人工知能(AI)には、かつては人間による入力が必要だったが、現在はコンピュータで実行できる、多くの複雑な新技術が含まれます。コンピュータは高度な機能を実行できます。これまで、この機能は情報を理解して推奨するために使用されていました。現在、AI によってコンピュータが新しいコンテンツを生成することもできます。
AI という略語は、AI 分野を構成するさまざまな種類のテクノロジーを表すために、しばしば同じ意味で使用されます。
AI の一般的なコンセプト
AI と ML を定義する用語とコンセプトがいくつかあります。ウェブ上で AI を実際に活用する方法は次のとおりです。
一般的な AI
一般的な AI とは、幅広い問題解決と創造性を発揮する人間以外のプログラムまたはモデルのことです。モデルは非常に大きな数式で、マシンが出力を返すために必要な一連のパラメータと構造が含まれています。
汎用 AI では、データの分析、テキストの翻訳、音楽の作成、病気の特定など、複数の種類のタスクを実行できます。
ナロー AI
ナロー AI は、単一または特定のサブセットのタスクを実行できるシステムです。たとえば、人間の相手とチェスをするコンピュータ(Mechanical Turk とは異なります)。ナロー AI には、事前定義された一連のパラメータ、制約、コンテキストがあります。これは理解しているように見えますが、実際には方程式の解答にすぎません。
顔認識システム、音声アシスタント、天気予報などで実践されています。非常に具体的なモデルを使用して、ウェブサイトやアプリの特定の機能を改善できます。
たとえば、映画専用のサイトを作成したとします。このサイトでは、ユーザーがログインして、お気に入りの映画に評価を付けたり、新しい映画を見つけたりできます。事前に入力されたデータベースを使用して、ユーザーが現在アクセスしているページに基づいて映画をおすすめできます。または、ユーザーの行動と設定を分析して、その読者に最も関連性の高い情報を表示するナロー AI モデルを使用することもできます。
生成 AI
大規模言語モデル(LLM)は、多くのパラメータを持つニューラル ネットワーク AI モデルであり、テキストや画像の生成、分類、要約など、さまざまなタスクの実行に使用できます。
生成 AI は入力に応答し、LLM のコンテキストとメモリに基づいてコンテンツを作成します。これは、パターン マッチングや予測を超えたものです。一般的な生成 AI ツールには、次のようなものがあります。
これらのツールを使用すると、文章、コードサンプル、画像を作成できます。たとえば、休暇の計画、メールの文面の柔らかさやプロフェッショナルな印象の調整、さまざまな情報セットのカテゴリ別分類などに役立ちます。
デベロッパーとデベロッパー以外のユーザーのユースケースは数え切れません。
クライアントサイド、サーバーサイド、ハイブリッド AI
ウェブ上の AI 機能のほとんどはサーバーに依存していますが、クライアントサイド AI はユーザーのブラウザで直接実行されます。これにより、低レイテンシ、サーバーサイドの費用削減、API キー不要、ユーザー プライバシーの強化、オフライン アクセスなどのメリットがもたらされます。Transformers.js、TensorFlow.js、MediaPipe などの JavaScript ライブラリを使用して、ブラウザ間で動作するクライアントサイド AI を実装できます。
サーバーサイド AI には、クラウドベースの AI サービスが含まれます。クラウド上で実行される Gemini 1.5 Pro と考えてください。これらのモデルは、はるかに大きく、より強力な傾向があります。これは特に大規模言語モデルに当てはまります。
ハイブリッド AI とは、クライアント コンポーネントとサーバー コンポーネントの両方を含むソリューションのことです。たとえば、クライアントサイド モデルを使用してタスクを実行し、タスクをデバイスで完了できない場合はサーバーサイド モデルにフォールバックできます。
特にパフォーマンスを重視して最適化されている場合、小さく最適化されたクライアントサイド モデルが、より大きなサーバーサイド モデルよりも優れたパフォーマンスを発揮することがあります。ユースケースを評価して、最適なソリューションを決定します。
機械学習(ML)
ML(機械学習)は、明示的なプログラミングなしでコンピュータが学習する AI の一種です。AI が知性を生成しようとするのに対し、ML はコンピュータが経験から学習できるようにします。ML は、データセットの予測を行うアルゴリズムで構成されています。
ML は、有用な予測を行うか、データからコンテンツを生成するモデルをトレーニングするプロセスです。
たとえば、特定の日付の天気を評価するウェブサイトを作成するとします。従来、この作業は 1 人以上の気象学者が行います。気象学者は地球の大気と地表の表現を作成し、気象パターンを計算して予測し、現在のデータを過去の状況と比較して評価を決定します。
代わりに、ML モデルに大量の気象データを提供して、気象パターン、過去のデータ、特定の日に天候が良好または悪くなる原因に関するガイドラインとの間の数学的な関係をモデルが学習するまで待つことができます。実際、これはウェブ上に構築されています。
ディープ ラーニング
ディープラーニング(DL)は ML アルゴリズムの一種です。たとえば、人間の脳が情報を処理する方法のモデル化を試みるディープ ニューラル ネットワーク(DNN)があります。
AI の課題
AI の構築と使用には、いくつかの課題があります。以下に、検討すべき点をいくつか示します。
データの品質と更新頻度
さまざまな AI モデルのトレーニングに使用される大規模なデータセットは、使用後すぐに古くなることがよくあります。つまり、最新情報を探す際には、プロンプト エンジニアリングを利用して、特定のタスクにおける AI モデルのパフォーマンスを高め、より優れた出力を生成できます。
データセットが不完全であるか、一部のユースケースを効果的にサポートするには小さすぎる場合があります。複数のツールを試したり、ニーズに合わせてモデルをカスタマイズしたりすると役に立ちます。
倫理とバイアスに関する懸念
AI テクノロジーは魅力的で、多くの可能性を秘めています。ただし、最終的には、コンピュータとアルゴリズムは人間によって構築され、人間が収集したデータでトレーニングされるため、いくつかの課題に直面します。たとえば、モデルは人間のバイアスと有害な固定観念を学習して増幅し、出力に直接影響する可能性があります。AI テクノロジーの構築にあたっては、バイアスの軽減を優先することが重要です。
AI 生成コンテンツの著作権については、多くの倫理的な考慮事項があります。特に、著作権で保護された素材から大きな影響を受けている場合や、直接コピーされている場合、出力の所有者は誰ですか?
新しいコンテンツやアイデアを生成する前に、作成したコンテンツの使用方法に関する既存のポリシーを検討してください。
セキュリティとプライバシー
多くのウェブ デベロッパーは、AI ツールの使用においてプライバシーとセキュリティが最大の懸念事項であると述べています。これは、政府や医療機関など、データ要件が厳しいビジネス コンテキストに特に当てはまります。Cloud API を使用してユーザーデータをより多くのサードパーティに公開することは懸念事項です。データ転送は安全に行われ、継続的にモニタリングされることが重要です。
このようなユースケースに対処するには、クライアントサイド AI が鍵となる可能性があります。今後、さらに研究開発を進めていく必要があります。
ウェブ上の AI を使ってみる
さまざまな種類の人工知能について理解できたので、既存のモデルを使用して生産性を高め、優れたウェブサイトとウェブ アプリケーションを構築する方法を検討してみましょう。
AI は次のような用途に使用できます。
- サイトの検索の自動入力を改善する。
- スマートカメラで、人間やペットなどの一般的な物体の存在を検出する
- 自然言語モデルを使用してコメント スパムに対処します。
- コードのオートコンプリートを有効にして、生産性を向上させましょう。
- 次の単語や文の候補を提示する WYSIWYG の文章作成エクスペリエンスを作成します。
- データセットに関するわかりやすい説明を提供します。
- その他...
事前トレーニング済みの AI モデルは、最も一般的な AI ツールを支える数学モデルの構築方法や複雑なデータセットの収集方法を完全に理解しなくても、ウェブサイト、ウェブアプリ、生産性を向上させるのに最適な方法です。
ほとんどのモデルは、追加の調整なしですぐにニーズを満たす場合があります。チューニングとは、大規模なデータセットですでにトレーニングされているモデルを取得し、特定の使用ニーズに合わせてさらにトレーニングするプロセスです。モデルをチューニングする方法はいくつかあります。
- 人間からのフィードバックを用いた強化学習(RLHF)は、人間からのフィードバックを使用して、人間の好みや意図とモデルの整合性を高める手法です。
- Low-Rank Adaptation(LoRA)は、モデルのパフォーマンスを維持しながら、トレーニング可能なパラメータの数を減らす LLM 向けのパラメータ効率的な方法です。