ترقية البحث في موقعك الإلكتروني: إجابات سياقية باستخدام الذكاء الاصطناعي التوليدي

يشير الذكاء الاصطناعي التوليدي إلى استخدام الذكاء الاصطناعي لإنشاء محتوى جديد، مثل النصوص والصور والموسيقى والصوت والفيديوهات. يعتمد الذكاء الاصطناعي التوليدي على نموذج تعلُّم الآلة لتعلُّم الأنماط والعلاقات في مجموعة بيانات تتضمّن محتوًى أنشأه المستخدمون.

وقد أظهرت هذه التكنولوجيا إمكانات مذهلة، من خلال تطبيقات مثل Gemini. قد تتساءل كيف يمكنني استخدام أدوات الذكاء الاصطناعي التوليدي في منتجات الويب الخاصة بي؟

تتمثل إحدى حالات الاستخدام الشائعة في تزويد المستخدمين بواجهة أفضل لطرح أسئلة حول محتوى موقع الويب. يمكنك تحسين نتائج بحث المستخدم بشكل كبير بمساعدة التعلم الآلي.

يمكنك إنشاء واجهة يمكن فيها للمستخدمين كتابة أسئلتهم التي يتم إرسالها بعد ذلك إلى نموذج لغوي كبير (LLM)، مثل Gemini، ومن ثم عرض الإجابات للمستخدمين.

لنفترض أن هناك ميزة من هذا القبيل على هذا الموقع. يريد أحد المستخدمين معرفة واجهات برمجة التطبيقات المضمّنة في Interop 2024، ويُدخل طلب البحث التالي:

What are the features included in Interop 24?

ولسوء الحظ، من المرجح أن تكون المخرجات غير صحيحة، لعدة أسباب:

  • لم يقدّم المستخدم سياقًا كافيًا للسؤال اللغوي الكبير، وبالتالي فإنّ النموذج اللغوي الكبير تكون أكثر عرضةً لإجابات خاطئة أو هلوسة.
  • من المرجّح أنّه تم تدريب النموذج اللغوي الكبير قبل إنشاء Interop 2024 أو تحديد ميزاته، وبالتالي فهو يغفل هذه المعلومات.

في حين أنّه يمكن للنماذج اللغوية الكبيرة العثور على المزيد من المعلومات الحديثة، فإنّ مجموعات البيانات التدريبية اللغوية الكبيرة بطبيعتها قديمة. يمكن أن يستغرق الحفاظ على نتائج جديدة وقتًا طويلاً ومكلفًا بشكل لا يصدق.

استخدام هندسة الطلبات

هندسة الطلبات هي مجموعة من الأساليب التي تهدف إلى الحصول على أفضل نتيجة من النموذج اللغوي الكبير.

ومن بين الأساليب توفير سياق إضافي في الطلب، ما يزيد من احتمال أن تنتج النموذج اللغوي الكبير محتوًى مرتبطًا بالسياق.

متابعة لمثال على خدمة التشغيل التفاعلي لدينا، تتمثل خطوتنا الأولى في تقديم المحتوى الكامل للمقالة كسياق. بعد ذلك، أضِف السؤال كمدخل النموذج اللغوي الكبير للإجابة عنه. مثال:

Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)

Input:
What are the features included in Interop 2024?

يمكنك توقع أن ينتج Gemini شيئًا مثل ما يلي:

The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL

من المحتمل أن تكون هذه الإجابة أفضل بكثير من طلب بدون سياق، لأنّ الإجابة تستند إلى السياق المقدّم.

التوسيع باستخدام طريقة RAG

على سبيل المثال، بدلاً من الإجابة عن سؤال حول مقالة واحدة، نريد أن يجيب النموذج اللغوي الكبير على المزيد من الأسئلة حول web.dev باستخدام أي مقالة كسياق إضافي. قد يكون ذلك ممكنًا بالنسبة إلى المواقع الإلكترونية الأصغر حجمًا، ونظرًا إلى فترة سياق Gemini 1.5 التي تتضمّن مليون رمز مميّز، فإنّ الطلبات الأكبر حجمًا تكون أبطأ وأكثر تكلفة في التشغيل.

يتمّ قياس أطوال المدخلات والمخرجات اللغوية الكبيرة وتحصيل الرسوم باستخدام رموز مميّزة، وهي طريقة لتمثيل تسلسل مشترك من الأحرف في أحد الإدخالات النصية. سيكون عدد الرموز المميزة أكبر من عدد الكلمات بشكل عام. على سبيل المثال، يحتوي الإدخال في المثال الأول على 775 كلمة، ممثلة بـ 1097 رموز مميزة. قد تحتسب النماذج اللغوية الكبيرة المختلفة الرموز المميّزة بشكل مختلف ويوفّر معظمها واجهة برمجة تطبيقات أو نقطة نهاية لاحتساب عدد الرموز المميّزة لإدخال النص.

ومن بين الحلول توفير المقالات ذات الصلة بالطلبات التي تقدّمها النموذج اللغوي الكبير (LLM). يجب إعطاء هذه المهمة جزأين:

  1. أضِف محتوى أهم المقالات كسياق عند تقديم النموذج اللغوي الكبير.
  2. ابحث في المحتوى عن مقالات ذات صلة بمقالة "ما هي الميزات المضمّنة في Interop 2024؟".

نريد أن تعرض نتائج Gemini محتوى استنادًا إلى المقالات التالية:

يجب أن يبدو الإدخال على النحو التالي:

Context:
Article 1:
Over the past two years... (trimmed)

Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)

Article 3:
Following on from the success of Interop 2022... (trimmed)

Input:
What are the features included in Interop 2024?

ينتج عن هذا السياق مخرجاتنا المتوقعة.

* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL

يستخدم هذا المنهج طريقة RAG الشائعة التي تهدف إلى زيادة احتمالية الحصول على إجابات حقيقية من أدوات الذكاء الاصطناعي التوليدي، وذلك بالنسبة إلى الأشخاص المطّلعين على تقنيات الذكاء الاصطناعي.

يمكن أن يعمل أسلوب RAG مع البحث العادي عن النص الكامل، ولكن هناك عيوب في هذا النهج.

  • تساعد ميزة البحث عن النص الكامل الذكاء الاصطناعي في العثور على الكلمات الرئيسية المطابقة تمامًا. ومع ذلك، لا يمكن للنماذج اللغوية الكبيرة تحديد المعنى المقصود من طلب بحث المستخدم. قد يؤدي هذا إلى مخرجات غير كاملة أو غير صحيحة.
  • قد تكون هناك مشكلات عندما تكون للكلمات ذات معانٍ متعددة أو عندما تستخدم طلبات البحث مرادفات. على سبيل المثال، قد تؤدي كلمة "مصرف" (أي مؤسسة مالية في مقابل ضفة النهر) إلى نتائج غير ذات صلة.
  • قد ينتج عن البحث بالنص الكامل نتائج تحتوي على الكلمات الرئيسية ولكنها لا تتوافق مع هدف المستخدم.

البحث الدلالي هو أسلوب لتحسين دقة البحث من خلال التركيز على الجوانب الرئيسية التالية:

  • نية الباحث: هي محاولة فهم سبب بحث المستخدم عن شيء ما. ما الذي يحاولون إيجاده أو تحقيقه؟
  • المعنى السياقي: تفسّر الكلمات والعبارات في ما يتعلّق بالنص المحيط بها، بالإضافة إلى عوامل أخرى مثل الموقع الجغرافي للمستخدم أو سجلّ البحث.
  • العلاقة بين المفاهيم: يستخدم البحث الدلالي الرسوم البيانية المعرفية (شبكات كبيرة من الكيانات ذات الصلة) ومعالجة اللغة الطبيعية لفهم العلاقة بين الكلمات والأفكار.

نتيجةً لذلك، عند إنشاء أدوات باستخدام البحث الدلالي، تعتمد نتائج البحث على الغرض العام من طلب البحث بدلاً من الكلمات الرئيسية. يعني هذا أنّ الأداة يمكنها تحديد مستندات ذات صلة، حتى في حال عدم توفّر الكلمة الرئيسية بالضبط. ويمكنه أيضًا تجنب النتائج التي تحتوي على الكلمة، ولكن لها معنى مختلف.

في الوقت الحالي، يمكنك تنفيذ أداتَين من أدوات البحث التي تستخدم البحث الدلالي: Vertex AI Search وAlgolia AI Search.

الحصول على إجابات من المحتوى المنشور

لقد تعلّمت كيفية استخدام هندسة الطلبات للسماح لنموذج لغوي كبير بتقديم إجابات ذات صلة بمحتوى لم تتم ملاحظته من قبل من خلال إضافة سياق إلى الطلب. وقد تعلمت كيفية توسيع هذا النهج من المقالات الفردية إلى مجموعة كاملة من المحتوى باستخدام أسلوب استعادة الجيل المعزز (RAG). لقد تعلمت كيف يمكن للبحث الدلالي أن يحسن نتائج طلبات بحث المستخدم بشكل أفضل، وتنفيذ طريقة RAG بشكل أفضل في منتجك.

إنها مشكلة معروفة يمكن أن تؤدي أدوات الذكاء الاصطناعي التوليدي إلى "الهلوسة"، ما يجعلها في أفضل الأحوال، أو غير موثوقة أحيانًا، أو في أسوأ الأحوال، تضرّ بشكل نشط بالنشاط التجاري. باستخدام هذه التقنيات، يمكن لكل من المستخدمين والمطورين تحسين الموثوقية، وربما بناء الثقة في مخرجات هذه التطبيقات.