ترقية البحث في موقعك الإلكتروني: إجابات سياقية باستخدام الذكاء الاصطناعي التوليدي

يشير الذكاء الاصطناعي التوليدي إلى استخدام الذكاء الاصطناعي لإنشاء محتوى جديد، مثل النصوص والصور والموسيقى والملفات الصوتية والفيديوهات. يعتمد الذكاء الاصطناعي التوليدي على نموذج تعلُّم الآلة للتعرّف على الأنماط والعلاقات في مجموعة بيانات تتضمّن محتوى من إنشاء المستخدمين.

أظهرت هذه التكنولوجيا إمكانات مذهلة من خلال تطبيقات مثل Gemini. قد تتساءل، كيف يمكنني تنفيذ أدوات الذكاء الاصطناعي التوليدي في منتجات الويب الخاصة بي؟

ومن حالات الاستخدام الشائعة توفير واجهة أفضل للمستخدمين لطرح أسئلة حول محتوى الموقع الإلكتروني. يمكنك تحسين نتائج البحث التي يعرضها محرّك بحث Google للمستخدمين بشكل كبير، بمساعدة تكنولوجيا تعلُّم الآلة.

يمكنك إنشاء واجهة يكتب فيها المستخدمون أسئلتهم، ويتم بعد ذلك إرسالها إلى نموذج لغوي كبير (LLM)، مثل Gemini، ثم عرض الإجابات للمستخدمين.

لنفترض أنّ هذه الميزة متوفّرة على هذا الموقع الإلكتروني. يريد المستخدم معرفة واجهات برمجة التطبيقات المضمّنة في أداة التشغيل المتداخل 2024، ويُدخِل الطلب التالي:

What are the features included in Interop 24?

من المحتمل أن تكون النتائج غير صحيحة لسببَين:

  • قدّم المستخدم للنموذج اللغوي الكبير القليل من السياق حول السؤال، وبالتالي يكون النموذج اللغوي أكثر عرضة لعرض إجابات خاطئة أو هلوسات.
  • من المحتمل أنّه تم تدريب النموذج اللغوي الكبير قبل إنشاء Interop 2024 أو تحديد ميزاته، لذا لا يعلم بهذه المعلومات.

بإمكان النماذج اللغوية الكبيرة العثور على مزيد من المعلومات الحديثة، إلا أنّ مجموعات بيانات تدريب النماذج اللغوية الكبيرة قديمة بطبيعتها. إنّ الحفاظ على نتائج جديدة يمكن أن يستغرق وقتًا طويلاً ويُكلّف الكثير من المال.

استخدام هندسة الطلبات

هندسة الطلبات هي مجموعة من الأساليب للحصول على أفضل النتائج من النموذج اللغوي الكبير.

ومن بين الأساليب التي يمكن استخدامها تقديم سياق إضافي في الطلب، ما يجعل من المرجّح أن يعرض نموذج اللغة الضخمة محتوًى ذا صلة بالسياق.

في ما يلي خطواتنا الأولى في ما يتعلّق بمثالنا على Interop: أولاً، نوفّر المحتوى الكامل للّغة المقالة كسياق. بعد ذلك، أضِف السؤال كمدخل لأجل LLM للإجابة عنه. على سبيل المثال:

Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)

Input:
What are the features included in Interop 2024?

يمكنك توقّع أن يُصدر Gemini ما يلي:

The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL

من المرجّح أن تكون هذه الإجابة أفضل بكثير من الإجابة عن طلب بدون سياق، لأنّ الإجابة تستند إلى السياق المقدَّم.

التوسّع باستخدام مقياس RAG

على سبيل المثال، بدلاً من الإجابة عن سؤال حول مقالة واحدة، نريد أن يجيب "النموذج اللغوي الكبير" عن المزيد من الأسئلة حول web.dev، باستخدام أي مقالة كمرجع إضافي. قد يكون هذا ممكنًا للمواقع الإلكترونية الأصغر حجمًا، نظرًا لقدرة استيعاب Gemini 1.5 التي تبلغ مليون رمز مميّز، ويكون تنفيذ الطلبات الأكبر حجمًا أبطأ وأعلى تكلفة.

يتم قياس أطوال إدخالات ومخرجات النماذج اللغوية الكبيرة وتحصيل رسومها برموز مميّزة، وهي طريقة لتمثيل تسلسل شائع من الأحرف في الإدخال النصي. سيكون عدد الرموز المميزة بشكل عام أكبر من عدد الكلمات. كمثال، كان الإدخال في المثال الأول يحتوي على 775 كلمة، ممثلة بـ 1097 من الرموز المميزة. قد تحسب نماذج اللغة الكبيرة المختلفة الرموز المميّزة بشكلٍ مختلف، ويقدّم معظمها واجهة برمجة تطبيقات أو نقطة نهاية لاحتساب عدد الرموز المميّزة لإدخال النص.

ومن بين الحلول التي يمكنك اتّخاذها تقديم المقالات ذات الصلة بطلبك في "البحث اللغوي الضخم". يجب أن تتضمن هذه المهمة جزأين:

  1. يجب إضافة محتوى أهم المقالات كسياق عند طلب النموذج اللغوي الكبير.
  2. ابحث في المحتوى عن مقالات ذات صلة بـ "ما هي الميزات المضمَّنة في Interop 2024؟"

نريد أن تعرِض نتائج Gemini محتوى استنادًا إلى المقالات التالية:

يجب أن يظهر الإدخال على النحو التالي:

Context:
Article 1:
Over the past two years... (trimmed)

Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)

Article 3:
Following on from the success of Interop 2022... (trimmed)

Input:
What are the features included in Interop 2024?

ينتج عن هذا السياق النتيجة المتوقّعة.

* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL

بالنسبة إلى المستخدمين المطلعين على تقنيات الذكاء الاصطناعي، يستخدم هذا النهج أسلوب RAG، وهو ممارسة شائعة لتحسين احتمالية ظهور إجابات حقيقية من أدوات الذكاء الاصطناعي التوليدي.

على الرغم من أنّ أسلوب RAG يمكن أن يعمل مع البحث العادي في النص الكامل، إلا أنّ هناك عيوبًا في هذا الأسلوب.

  • يساعد البحث بالنص الكامل الذكاء الاصطناعي في العثور على نتائج مطابقة تمامًا للكلمات الرئيسية. ومع ذلك، لا يمكن للنماذج اللغوية الكبيرة تحديد المعنى المقصود وراء طلب بحث المستخدم. قد يؤدي ذلك إلى أن المخرجات غير مكتملة أو غير صحيحة.
  • قد تحدث مشاكل عندما يكون للكلمات معانٍ متعدّدة أو عندما تستخدِم طلبات البحث مرادفات. على سبيل المثال، يمكن أن يؤدي البحث عن "البنك" (المؤسسة المالية مقابل ضفة النهر) إلى عرض نتائج غير ملائمة.
  • قد تؤدي عملية البحث عن النص الكامل إلى عرض نتائج تحتوي على الكلمات الرئيسية، ولكنها لا تتوافق مع هدف المستخدم.

البحث الدلالي هو أسلوب لتحسين دقة البحث من خلال التركيز على الجوانب الرئيسية التالية:

  • الغرض من البحث: هو محاولة فهم سبب بحث المستخدم عن محتوى محدّد. ما الذي يحاولون العثور عليه أو تحقيقه؟
  • المعنى السياقي: يتم تفسير الكلمات والعبارات استنادًا إلى النص المحيط بها، بالإضافة إلى عوامل أخرى، مثل الموقع الجغرافي للمستخدم أو سجلّ البحث.
  • العلاقة بين المفاهيم: يستخدم البحث الدلالي الرسوم البيانية المعرفية (وهي شبكات كبيرة من الكيانات ذات الصلة) ومعالجة اللغات الطبيعية لفهم كيفية ارتباط الكلمات والأفكار.

نتيجةً لذلك، عندما تنشئ أدوات باستخدام البحث الدلالي، تعتمد نتائج البحث على الغرض العام من طلب البحث، بدلاً من الكلمات الرئيسية. وهذا يعني أنّ الأداة يمكنها تحديد المستندات ذات الصلة، حتى في حال عدم توفّر الكلمة الرئيسية المحدّدة. ويمكنه أيضًا تجنُّب النتائج التي تتضمّن الكلمة ولكن لها معنى مختلف.

يمكنك حاليًا استخدام أداتَي بحث تستخدمان البحث الدلالي: Vertex AI Search و Algolia AI Search.

استخراج الإجابات من المحتوى المنشور

لقد تعلّمت كيفية استخدام هندسة الطلب لتمكين نموذج تعلُّم لغوي ضخم من تقديم إجابات عن محتوى لم يسبق له رؤيته من خلال إضافة سياق إلى الطلب. ولقد تعرّفت على كيفية توسيع نطاق هذا النهج من المقالات الفردية إلى مجموعة كاملة من المحتوى باستخدام أسلوب الإنشاء المعزّز بالاسترجاع (RAG). لقد تعرّفت على كيفية تحسين البحث الدلالي للنتائج التي تظهر لطلبات البحث التي يجريها المستخدِمون، ما يؤدي إلى تنفيذ نموذج RAG بشكل أفضل في منتجك.

من المعروف أنّ أدوات الذكاء الاصطناعي التوليدي يمكن أن "تهلوس"، ما يجعلها في أحسن الأحوال غير موثوقة أحيانًا، وفي أسوأ الأحوال ضارة بشكل نشط لنشاطك التجاري. باستخدام هذه الأساليب، يمكن للمستخدمين والمطوّرين على حد سواء تحسين الموثوقية، وربما بناء الثقة في النتائج التي تحقّقها هذه التطبيقات.