يشير الذكاء الاصطناعي التوليدي إلى استخدام الذكاء الاصطناعي لإنشاء محتوى جديد، مثل النصوص والصور والموسيقى والملفات الصوتية والفيديوهات. يعتمد الذكاء الاصطناعي التوليدي على نموذج تعلُّم الآلة للتعرّف على الأنماط والعلاقات في مجموعة بيانات تتضمّن محتوى من إنشاء المستخدمين.
أظهرت هذه التكنولوجيا إمكانات مذهلة من خلال تطبيقات مثل Gemini. قد تتساءل، كيف يمكنني تنفيذ أدوات الذكاء الاصطناعي التوليدي في منتجات الويب الخاصة بي؟
ومن حالات الاستخدام الشائعة توفير واجهة أفضل للمستخدمين لطرح أسئلة حول محتوى الموقع الإلكتروني. يمكنك تحسين نتائج البحث التي يعرضها محرّك بحث Google للمستخدمين بشكل كبير، بمساعدة تكنولوجيا تعلُّم الآلة.
إنشاء ميزة بحث أفضل خاصة بالموقع الإلكتروني
يمكنك إنشاء واجهة يكتب فيها المستخدمون أسئلتهم، ويتم بعد ذلك إرسالها إلى نموذج لغوي كبير (LLM)، مثل Gemini، ثم عرض الإجابات للمستخدمين.
لنفترض أنّ هذه الميزة متوفّرة على هذا الموقع الإلكتروني. يريد أحد المستخدِمين معرفة واجهات برمجة التطبيقات التي تم تضمينها في Interop 2024، ويُدخل طلب البحث التالي:
What are the features included in Interop 24?
من المحتمل أن تكون النتيجة غير صحيحة لسببَين:
- لم يقدّم المستخدم للنموذج اللغوي الكبير الكثير من السياق حول السؤال، لذلك يكون النموذج اللغوي أكثر عرضة لعرض إجابات خاطئة أو هلوسات.
- من المحتمل أنّه تم تدريب النموذج اللغوي الكبير قبل إنشاء Interop 2024 أو تحديد ميزاته، لذا لا يعلم بهذه المعلومات.
على الرغم من أنّه من الممكن أن تعثر النماذج اللغوية الكبيرة على معلومات أكثر حداثة، إلا أنّ مجموعات بيانات تدريب النماذج اللغوية الكبيرة قديمة بطبيعتها. إنّ الحفاظ على نتائج جديدة يمكن أن يكون مكلفًا ويستهلك وقتًا طويلاً.
استخدام هندسة الطلبات
هندسة الطلبات هي مجموعة من التقنيات للحصول على أفضل نتيجة من نموذج لغوي كبير (LLM).
ومن بين الأساليب التي يمكن اتّباعها تقديم سياق إضافي في الطلب، ما يجعل من المرجّح أن يعرض نموذج اللغة الضخمة محتوًى ذا صلة بالسياق.
في ما يلي خطواتنا الأولى في ما يتعلّق بمثالنا على Interop: أولاً، نوفّر المحتوى الكامل للمقالة كسياق. بعد ذلك، أضِف السؤال كمدخل لأجل LLM للإجابة عنه. على سبيل المثال:
Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)
Input:
What are the features included in Interop 2024?
يمكنك توقّع أن يعرض Gemini نتيجة مماثلة لما يلي:
The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL
من المرجّح أن تكون هذه الإجابة أفضل بكثير من الإجابة عن طلب بدون سياق، لأنّ الإجابة تستند إلى السياق المقدَّم.
التوسّع باستخدام مقياس RAG
على سبيل المثال، بدلاً من الإجابة عن سؤال حول مقالة واحدة، نريد أن يجيب "النموذج اللغوي الكبير" عن المزيد من الأسئلة حول web.dev، باستخدام أي مقالة كمرجع إضافي. قد يكون هذا ممكنًا للمواقع الإلكترونية الأصغر حجمًا، نظرًا لقدرة استيعاب Gemini 1.5 التي تبلغ مليون رمز مميّز، ويكون تنفيذ الطلبات الأكبر حجمًا أبطأ وأعلى تكلفة.
يتم قياس طول إدخال النماذج اللغوية الكبيرة وإخراجها واحتساب رسومها باستخدام الرموز المميّزة، وهي إحدى الطُرق لتمثيل تسلسل شائع من الأحرف المتوفّرة في نص الإدخال. سيكون عدد الرموز بشكل عام أكبر من عدد الكلمات. على سبيل المثال، كان النص في المثال الأول يتضمّن 775 كلمة، تم تمثيلها من خلال 1097 رمزًا. قد تحسب نماذج اللغة الكبيرة المختلفة الرموز المميّزة بشكلٍ مختلف، ويقدّم معظمها واجهة برمجة تطبيقات أو نقطة نهاية لاحتساب عدد الرموز المميّزة لإدخال النص.
ومن بين الحلول التي يمكنك اتّخاذها تقديم المقالات ذات الصلة بطلبك في "البحث اللغوي الضخم". يجب أن تتضمن هذه المهمة جزأين:
- أضِف محتوى أهم المقالات كسياق عند طلب استخدام نموذج "التعلم الآلي على مستوى اللغة".
- ابحث في المحتوى عن مقالات ذات صلة بـ "ما هي الميزات المضمّنة في Interop 2024؟".
نريد أن تعرِض نتائج Gemini محتوى استنادًا إلى المقالات التالية:
- المقالة 1: web.dev/blog/submit-your-proposals-for-interop-2024
- المقالة 2: web.dev/blog/interop-2023-wrapup
- المقالة 3: web.dev/blog/interop-2024
من المفترض أن يظهر الإدخال على النحو التالي:
Context:
Article 1:
Over the past two years... (trimmed)
Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)
Article 3:
Following on from the success of Interop 2022... (trimmed)
Input:
What are the features included in Interop 2024?
ينتج عن هذا السياق النتيجة المتوقّعة.
* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL
بالنسبة إلى المستخدمين المطلعين على تقنيات الذكاء الاصطناعي، يستخدم هذا النهج نموذج RAG، وهي ممارسة شائعة لتحسين احتمالية ظهور إجابات حقيقية من أدوات الذكاء الاصطناعي التوليدي.
تحسين النتائج باستخدام البحث الدلالي
على الرغم من أنّ أسلوب RAG يمكن أن يعمل مع البحث العادي في النص الكامل، إلا أنّ هناك عيوبًا في هذا الأسلوب.
- يساعد البحث عن النص الكامل الذكاء الاصطناعي في العثور على مطابقات الكلمات الرئيسية الدقيقة. ومع ذلك، لا يمكن لتكنولوجيات المعالجة اللغوية الضخمة تحديد المعنى المقصود من طلب المستخدم. وقد يؤدي ذلك إلى عدم اكتمال النتائج أو عدم صحتها.
- قد تحدث مشاكل عندما يكون للكلمات معانٍ متعدّدة أو عندما تستخدِم طلبات البحث مرادفات. على سبيل المثال، يمكن أن يؤدي البحث عن "البنك" (المؤسسة المالية مقابل ضفة النهر) إلى عرض نتائج غير ملائمة.
- قد تؤدي عملية البحث عن النص الكامل إلى عرض نتائج تحتوي على الكلمات الرئيسية، ولكنها لا تتوافق مع هدف المستخدم.
البحث الدلالي هو أسلوب لتحسين دقة البحث من خلال التركيز على الجوانب الرئيسية التالية:
- نية الباحث: يحاول فهم سبب بحث المستخدم عن موضوع معيّن. ما الذي يحاولون العثور عليه أو تحقيقه؟
- المعنى السياقي: يتم تفسير الكلمات والعبارات استنادًا إلى النص المحيط بها، بالإضافة إلى عوامل أخرى، مثل الموقع الجغرافي للمستخدم أو سجلّ البحث.
- العلاقة بين المفاهيم: يستخدم البحث الدلالي الرسوم البيانية المعرفية (وهي مجموعات كبيرة من العناصر ذات الصلة) ومعالجة اللغة الطبيعية لفهم كيفية ارتباط الكلمات والأفكار.
نتيجةً لذلك، عند إنشاء أدوات باستخدام البحث الدلالي، تعتمد نتائج البحث على الغرض العام لطلب البحث، بدلاً من الكلمات الرئيسية. وهذا يعني أنّ الأداة يمكنها تحديد المستندات ذات الصلة، حتى في حال عدم توفّر الكلمة الرئيسية المحدّدة. ويمكنه أيضًا تجنُّب النتائج التي تتضمّن الكلمة ولكن لها معنى مختلف.
يمكنك حاليًا استخدام أداتَي بحث تستخدمان البحث الدلالي: Vertex AI Search و Algolia AI Search.
استخراج الإجابات من المحتوى المنشور
لقد تعلّمت كيفية استخدام هندسة الطلب لتمكين نموذج تعلُّم لغوي ضخم من تقديم إجابات ذات صلة بمحتوى لم يسبق له رؤيته من خلال إضافة سياق إلى الطلب. ولقد تعرّفت على كيفية توسيع نطاق هذا النهج من المقالات الفردية إلى مجموعة كاملة من المحتوى باستخدام أسلوب الإنشاء المعزّز بالاسترجاع (RAG). لقد تعرّفت على كيفية تحسين البحث الدلالي للنتائج التي تظهر لطلبات البحث التي يجريها المستخدِمون، ما يؤدي إلى تنفيذ نموذج RAG بشكل أفضل في منتجك.
من المعروف أنّ أدوات الذكاء الاصطناعي التوليدي يمكن أن "تهلوس"، ما يجعلها في أحسن الأحوال غير موثوقة أحيانًا، وفي أسوأ الأحوال ضارة بشكل نشط لنشاطك التجاري. باستخدام هذه الأساليب، يمكن للمستخدمين والمطوّرين على حد سواء تحسين الموثوقية، وربما بناء الثقة في النتائج التي تحقّقها هذه التطبيقات.