Google I/O にご参加いただきありがとうございました。オンデマンドでコンテンツを視聴できます。

このページは Cloud Translation API によって翻訳されました。

AI とは

Alexandra Klepper

人工知能（AI）には、かつては人間による入力が必要だったが、現在はコンピュータで実行できる、多くの複雑な新技術が含まれます。広義に言えば、AI は、幅広い問題解決と創造性を発揮する人間以外のプログラムまたはモデルです。

コンピュータは高度な機能を実行できます。これまで、この機能は情報を理解して推奨するために使用されていました。AI の登場により、コンピュータは新しいコンテンツを生成できるようになりました。

AI という略語は、AI 分野を構成するさまざまな種類のテクノロジーを示すために、しばしば同じ意味で使用されます。

AI の一般的なコンセプト

AI と ML を定義する用語とコンセプトがいくつかあります。ウェブ上で AI を実際に活用する方法は次のとおりです。

生成 AI と大規模言語モデル

生成 AI は入力に応答し、大規模言語モデルのコンテキストとメモリに基づいてコンテンツを作成します。

大規模言語モデル（LLM）は、多数（多くの場合数十億）のパラメータを持つ AI モデルであり、テキストや画像の生成、分類、要約など、さまざまなタスクの実行に使用できます。

生成 AI は、パターンマッチングや予測を超えて、一般的な生成 AI ツールには次のようなものがあります。

Google の Gemini
Open AI の Chat GPT
Anthropic の Claude
Microsoft の Copilot
その他多数

これらのツールは、文章、コードサンプル、画像を作成できます。たとえば、休暇の計画、メールの文面の柔らかさやプロフェッショナルな表現の調整、さまざまな情報セットのカテゴリ分類などに役立ちます。

デベロッパーとデベロッパー以外のユーザーのユースケースは数え切れません。

クライアントサイド AI

ウェブ上の AI 機能のほとんどはサーバーに依存していますが、クライアントサイド AI はユーザーのブラウザで実行され、ユーザーのデバイスで推論を行います。これにより、レイテンシの短縮、サーバーサイドの費用の削減、API キーの要件の削除、ユーザーのプライバシーの強化、オフラインアクセスが可能になります。Transformers.js、TensorFlow.js、MediaPipe などの JavaScript ライブラリを使用して、ブラウザ間で動作するクライアントサイド AI を実装できます。

特にパフォーマンスを重視して最適化されている場合、小さな最適化済みクライアントサイドモデルが、より大きなサーバーサイドモデルよりも優れたパフォーマンスを発揮することがあります。ユースケースを評価して、最適なソリューションを決定します。

サーバーサイド AI

サーバーサイド AI には、クラウドベースの AI サービスが含まれます。クラウド上で実行される Gemini 1.5 Pro と考えてください。これらのモデルは、はるかに大きく、より強力な傾向があります。これは特に大規模言語モデルに当てはまります。

ハイブリッド AI

ハイブリッド AI とは、クライアントコンポーネントとサーバーコンポーネントの両方を含むソリューションのことです。たとえば、クライアントサイドモデルを使用してタスクを実行し、タスクをデバイスで完了できない場合はサーバーサイドモデルにフォールバックできます。

機械学習（ML）

ML（機械学習）は、明示的なプログラミングなしでコンピュータが学習する AI の一種です。AI が知能を生成しようとしているのに対し、ML はコンピュータが経験から学習できるようにします。ML は、データセットの予測を行うアルゴリズムで構成されています。

ML は、有用な予測を行うか、データからコンテンツを生成するモデルをトレーニングするプロセスです。

たとえば、特定の日付の天気を評価するウェブサイトを作成するとします。従来、この作業は 1 人以上の気象学者が行います。気象学者は地球の大気と地表の表現を作成し、気象パターンを計算して予測し、現在のデータを過去の状況と比較して評価を決定します。

代わりに、ML モデルに大量の気象データを提供して、気象パターン、過去のデータ、特定の日に天候が良好または悪くなる原因に関するガイドラインとの間の数学的な関係をモデルが学習するまで待つことができます。実際、これはウェブ上に構築されています。

ディープラーニング

ディープラーニング（DL）は ML アルゴリズムの一種です。たとえば、人間の脳が情報を処理する方法のモデル化を試みるディープニューラルネットワーク（DNN）があります。

AI の課題

AI の構築と使用には、いくつかの課題があります。以下に、考慮すべき点をいくつか示します。

データの品質と更新頻度

さまざまな AI モデルのトレーニングに使用される大規模なデータセットは、使用後すぐに古くなることがよくあります。つまり、最新情報を探す場合は、プロンプトエンジニアリングを使用して、特定のタスクでの AI モデルのパフォーマンスを強化し、より良い出力を生成できます。

データセットが不完全であるか、一部のユースケースを効果的にサポートするには小さすぎる場合があります。複数のツールを試したり、ニーズに合わせてモデルをカスタマイズしたりすると役に立ちます。

倫理とバイアスに関する懸念

AI テクノロジーは魅力的で、多くの可能性を秘めています。ただし、最終的には、コンピュータとアルゴリズムは人間によって構築され、人間が収集したデータでトレーニングされるため、いくつかの課題に直面します。たとえば、モデルは人間のバイアスと有害なステレオタイプを学習して増幅し、出力に直接影響する可能性があります。AI テクノロジーの構築にあたっては、バイアスの軽減を優先することが重要です。

AI 生成コンテンツの著作権については、多くの倫理的な考慮事項があります。特に、著作権で保護された素材から大きな影響を受けている場合や、直接コピーされている場合、出力の所有者は誰ですか？

新しいコンテンツやアイデアを生成する前に、作成したコンテンツの使用方法に関する既存のポリシーを検討してください。

セキュリティとプライバシー

多くのウェブデベロッパーは、AI ツールの使用においてプライバシーとセキュリティが最大の懸念事項であると述べています。これは、政府や医療機関など、データ要件が厳しいビジネスコンテキストに特に当てはまります。Cloud API を使用してユーザーデータをより多くのサードパーティに公開することは懸念されます。データ転送は安全に行われ、継続的にモニタリングされることが重要です。

このようなユースケースに対処するには、クライアントサイド AI が鍵となる可能性があります。今後、さらに研究開発を進めていく必要があります。

ウェブ上の AI を使ってみる

さまざまな種類の人工知能について理解できたので、既存のモデルを使用して生産性を高め、優れたウェブサイトとウェブアプリケーションを構築する方法を検討してみましょう。

AI は次のような用途に使用できます。

サイトの検索の自動入力を改善する。
スマートカメラで、人間やペットなどの一般的な物体の存在を検出する
自然言語モデルを使用してコメントスパムを対処します。
コードの自動補完を有効にして生産性を向上させましょう。
次の単語や文の候補を提示する WYSIWYG の文章作成エクスペリエンスを作成します。
データセットに関するわかりやすい説明を提供します。
その他...

事前トレーニング済みの AI モデルは、最も一般的な AI ツールを支える数学モデルの構築方法や複雑なデータセットの収集方法を完全に理解しなくても、ウェブサイト、ウェブアプリ、生産性を向上させるのに最適な方法です。

ほとんどのモデルは、追加の調整なしですぐにニーズを満たす場合があります。チューニングとは、大規模なデータセットですでにトレーニングされているモデルを取得し、特定のユースケースのニーズに合わせてさらにトレーニングするプロセスです。モデルをチューニングする方法はいくつかあります。

人間からのフィードバックを用いた強化学習（RLHF）は、人間からのフィードバックを使用して、モデルを人間の好みや意図に合わせる手法です。
Low-Rank Adaptation（LoRA）は、モデルのパフォーマンスを維持しながらトレーニング可能なパラメータの数を減らす、LLM 向けのパラメータ効率的な方法です。