多くの ML 用語の主な信頼できる情報源は、ML 用語集です。重複を避けるため、ML 用語集にない一般的な単語や用語のみを掲載しています。
AI システムのブループリント
新しい AI 機能やプロダクトを構築する際は、AI システムのブループリントを定義し、AI の機会をソリューションの構築方法にマッピングします。次のものを定義する必要があります。
- なぜ構築するのですか?利用可能な AI ユースケースと、ユーザーにもたらす価値を教えてください。
- アプリケーションの仕組み
- システムの各部分が責任を持って開発されるようにするには、どうすればよいですか?
ブループリントについては、ウェブ上の AI の概要をご覧ください。
複合 AI アーキテクチャ
複合 AI アーキテクチャ: 1 つ以上のモデルと、データベース、API、ガードレールなどの他のコンポーネントを組み合わせて、堅牢でコンテキストを認識した動作を実現する
コンテキスト エンジニアリング
コンテキスト エンジニアリングは、特定のリクエストに対して最も関連性の高い情報(トークン)を動的に選択し、価値のある結果が得られる確率を最大化するプロセスです。
データドリフト
データドリフトは、トレーニング データが現実を代表しなくなった場合に発生します。ユーザーの行動、データ収集、データ環境はいつでも変化する可能性があり、モデルのパフォーマンスの低下につながる可能性があります。
決定論的ソフトウェア
決定論的ソフトウェアは、特定の入力が与えられると、常に同じ一連の手順に従って同じ出力に導きます。これらは予測可能で効率的に実行されるため、最も信頼性の高いソフトウェア タイプです。
AI は決定的ではありません。同じプロンプトでも、経路と結果は大きく異なる場合があります。
評価主導開発(EDD)
評価主導開発(EDD)フレームワークは、出力を小規模で確実なステップで改善し、回帰を検出し、モデルの動作をユーザーとプロダクトの期待に沿って調整するための、再現可能でテスト可能なプロセスを提供します。
これは、AI の不確実性に対応したテスト駆動開発(TDD)と考えることができます。決定論的な単体テストとは異なり、AI 評価はハードコードできません。出力(整形式の出力と失敗した出力の両方)は、予測できないさまざまな形式になる可能性があるためです。
生成 AI
生成 AI は、コンテンツを作成できる ML システムです。つまり、モデルはテキストの作成、画像の生成、コードの生成、さらには完全なユーザー インターフェースの設計も可能です。
ガバナンス
AI ガバナンスの 3 つの側面について説明します。
- プライバシー: 責任をもってデータを処理し、収集されるデータを説明し、ブラウザから送信されるデータを最小限に抑えます。
- 公平性: モデルに差別的な動作(バイアス)がないか確認し、ユーザーが問題を報告できるループを構築します。
- 信頼と透明性: 透明性と調整された信頼性を実現するようにシステムを設計します。これにより、不確実性や潜在的な間違いがあっても、ユーザーはシステムから引き続きメリットを得ることができます。
最後のディメンションであるセキュリティは、AI ガバナンスの重要なディメンションです。セキュリティの詳細については、今後のモジュールで取り上げる予定です。
それまでの間、Google のセキュア AI フレームワーク(SAIF)と Google セキュリティ ブログをお読みになることをおすすめします。
モデル
モデルは、AI システムの最も重要なバックボーンです。モデルは、システムが予測を行うために必要なパラメータと構造のセットです。モデルの動作は、トレーニング スタイル(教師ありまたは教師なし)とモデルの目的(予測または生成)によって異なります。
モデルカード
モデルカードは、モデルの設計と評価の方法の概要を構造化したものです。これらは、Google の責任ある AI への取り組みをサポートする重要なアーティファクトとして機能します。
モデルの重み
モデルの重みは、特定の情報の重要度を決定する数値です。これらの値は、理想的な重みが設定されるまで、モデルのトレーニングで継続的に更新されます。Gemma などのオープンモデルの重みを変更できます。
AI の活用機会
AI ソリューションを分類するカテゴリは多数あります。
- 分析情報: 意思決定を改善します。
- 利便性: 顧客のストレスをなくします。
- 自動化: 反復作業を置き換えます。
- 拡張: 複雑なタスクやクリエイティブなタスクでユーザーをサポートします。
- パーソナライズ: 個々のニーズや好みに合わせてプロダクトを調整します。
これについては、ユースケースを確認するで詳しく説明しています。
プラットフォーム
クライアントサイド AI はブラウザで直接実行されます。これにより、データはユーザーのデバイス上で非公開のままとなり、ネットワーク レイテンシも発生しません。ただし、クライアントサイド AI が適切に機能するには、非常に具体的で明確に定義されたユースケースが必要です。
サーバーサイド AI には、クラウドでホストされ、推論を実行するモデルが含まれます。この方法は、高い能力とスケーラビリティを備えていますが、費用が高くなる可能性があり、ネットワーク接続が必要です。
予測 AI
予測(分析)AI は、既存のデータを理解し、次に何が起こるかを予測するのに役立つアルゴリズムのコレクションです。予測 AI モデルは、過去のパターンに基づいて結果を予測し、分析情報を明らかにし、よりスマートな意思決定を推進するように学習します。
プロンプト エンジニアリング
プロンプト エンジニアリングとは、ユーザーの期待に沿った出力を生成するために、プロンプトを記述して書き直すことです。適切に記述されたプロンプト:
- LLM が回答をどのように作成すべきかを指定します。
- バージョン管理、テスト、改善を時間の経過とともに実施できる複数のコンポーネントで構成されます。
- チーム間のコラボレーションのための共有アーティファクトとして機能します。
プロンプト エンジニアリングでは、さまざまな手法を使用できます。詳しくは、プロンプト エンジニアリング モジュールをご覧ください。
プロンプトの種類
プロンプト タイプは、プロンプトの対象ユーザーと考えることができます。詳しくは、プロンプト エンジニアリング モジュールをご覧ください。
システム プロンプト
システム プロンプトはアプリケーション デベロッパーによって提供され、モデルの全体的な動作を定義します。モデルの役割(「あなたはライティング アシスタントです」)、期待されるトーン、出力形式(厳密な JSON スキーマなど)、グローバル制約を設定できます。このプロンプトはリクエスト間で安定しています。
ユーザーによるプロンプト
ユーザー プロンプトには、出力につながる直接的なリクエストが含まれます。ユーザーが何らかの入力変数(テキストの選択や期待されるスタイルなど)を指定して、特定のタスクをリクエストします。たとえば、「この投稿のタイトルを 3 つ生成して」、「この段落を続けて」、「もっとフォーマルにして」などと指示します。