يشير الذكاء الاصطناعي التوليدي إلى استخدام لإنشاء محتوى جديد، مثل النصوص والصور والموسيقى والمقاطع الصوتية والفيديوهات. يعتمد الذكاء الاصطناعي التوليدي على نموذج تعلُّم الآلة الأنماط والعلاقات في مجموعة بيانات للمحتوى الذي أنشأه البشر.
وقد أثبتت هذه التكنولوجيا قدرات مذهلة، من خلال تطبيقات مثل Gemini. قد تتساءل، كيف يمكنني تنفيذ هل يتم تضمين أدوات الذكاء الاصطناعي التوليدي في منتجاتي على الويب؟
إحدى حالات الاستخدام الشائعة هي توفير واجهة أفضل للمستخدمين لطرح الأسئلة حول محتوى موقع الويب. يمكنك تحسين نتائج البحث التي تظهر للمستخدم بشكل كبير، بمساعدة التعلم الآلي.
إنشاء بحث أفضل مخصص للمواقع الإلكترونية
يمكنك إنشاء واجهة يكتب فيها المستخدمون سؤالهم، والتي يتم إرسالها إلى نموذج لغوي كبير (LLM)، مثل Gemini، ثم تعرض الإجابات للمستخدمين.
لنفترض أن هذه الميزة موجودة على هذا الموقع. يريد أحد المستخدمين معرفة واجهات برمجة التطبيقات في أداة التشغيل المتداخل 2024، ويتم إدخال طلب البحث التالي:
What are the features included in Interop 24?
ومن المرجح أن تكون المخرجات غير صحيحة لعدة أسباب:
- لقد قدّم المستخدم سياقًا بسيطًا للسؤال في النموذج اللغوي الكبير، وبالتالي النموذج اللغوي الكبير. أكثر عرضة لإرجاع إجابات خاطئة أو الهلوسة.
- من المرجّح أنّه تم تدريب النموذج اللغوي الكبير قبل إنشاء أداة التشغيل التفاعلي 2024 أو على ميزاتها. لذلك لا يكون على دراية بتلك المعلومات.
بإمكان النماذج اللغوية الكبيرة العثور على مزيد من المعلومات الحديثة، وتدريب النموذج اللغوي الكبير ومجموعات البيانات قديمة بطبيعتها. يمكن أن يكون الحفاظ على نتائج جديدة تستغرق وقتًا طويلاً ومكلفة.
استخدام هندسة الطلبات
هندسة الطلبات هي مجموعة من الأساليب للحصول على أفضل النتائج من النموذج اللغوي الكبير.
أحد الأساليب هو توفير سياق إضافي في الطلب، ما يجعل النموذج اللغوي الكبير (LLM) من المرجح أن تسفر عن محتوى مرتبط بالسياق.
استكمالاً لمثال إمكانية التشغيل التفاعلي، تتمثل خطوتنا الأولى في تقديم كامل محتوى المقالة كسياق. ثم أضف السؤال كمدخل نموذج لغوي كبير (LLM) للردّ. على سبيل المثال:
Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)
Input:
What are the features included in Interop 2024?
يمكنك توقّع أن يُصدر Gemini ما يلي:
The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL
من المحتمل أن تكون هذه الإجابة أفضل بكثير من مطالبة بدون سياق، حيث "الإجابة" بناءً على السياق المقدم.
التوسُّع باستخدام طريقة RAG
فعلى سبيل المثال، بدلاً من الإجابة عن سؤال متعلق بمقالة واحدة، نريد للإجابة عن المزيد من الأسئلة حول web.dev، باستخدام أي مقالة سياق إضافي. رغم أنّ هذا الإجراء قد يكون ممكنًا في المواقع الإلكترونية الأصغر حجمًا، استنادًا إلى مليون رمز مميز في Gemini 1.5 تكون الطلبات الأكبر حجمًا أبطأ وأكثر تكلفة في التنفيذ.
يتم قياس أطوال المدخلات والمخرجات للنماذج اللغوية الكبيرة وتحصيل رسومها بالرموز المميّزة، وهي لتمثيل تسلسل شائع من الأحرف الموجودة في إدخال نصي. تشير رسالة الأشكال البيانية سيكون عدد الرموز المميزة أكبر من عدد الكلمات بشكل عام. على سبيل المثال، مثال، كان المدخل في المثال الأول 775 كلمة، يمثلها 1097 الرموز المميزة. قد تحسب النماذج اللغوية الكبيرة المختلفة الرموز المميّزة بشكل مختلف، ويوفّر معظمها واجهة برمجة تطبيقات أو نقطة نهاية لحساب عدد الرموز المميزة لإدخال النص.
أحد الحلول هو تقديم المقالات ذات الصلة بالطلبات التي تقدّمها النماذج اللغوية الكبيرة (LLM). ينبغي أن تكون هذه المهمة على جزأين:
- يجب إضافة محتوى أهم المقالات كسياق عند طلب النموذج اللغوي الكبير.
- ابحث في المحتوى عن مقالات متعلقة بـ "ما هي الميزات المضمنة في إمكانية التشغيل التفاعلي لعام 2024؟".
نريد أن تعرض نتائج Gemini المحتوى استنادًا إلى المقالات التالية:
- المادة 1: web.dev/blog/submit-your-proposals-for-interop-2024
- المادة 2: web.dev/blog/interop-2023-wrapup
- المادة 3: web.dev/blog/interop-2024
يجب أن يظهر الإدخال على النحو التالي:
Context:
Article 1:
Over the past two years... (trimmed)
Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)
Article 3:
Following on from the success of Interop 2022... (trimmed)
Input:
What are the features included in Interop 2024?
ينتج هذا السياق مخرجاتنا المتوقعة.
* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL
وبالنسبة إلى هؤلاء الذين هم على دراية بتقنيات الذكاء الاصطناعي، يستخدم هذا النهج طريقة RAG، وهي ممارسة شائعة لزيادة احتمالية الحصول على إجابات حقيقية من أدوات الذكاء الاصطناعي التوليدي.
تحسين النتائج باستخدام البحث الدلالي
بينما يمكن أن يعمل أسلوب RAG مع البحث العادي عن النص الكامل، هناك وأوجه القصور في النهج.
- يساعد البحث بالنص الكامل الذكاء الاصطناعي في العثور على نتائج مطابقة تمامًا للكلمات الرئيسية. ولا يمكن للنماذج اللغوية الكبيرة لتحديد المعنى المقصود وراء طلب بحث المستخدم. وهذا يمكن أن يؤدي إلى المخرجات غير مكتملة أو غير صحيحة.
- قد تكون هناك مشاكل عندما يكون للكلمات معانٍ متعددة أو عندما تستخدم طلبات البحث المرادفات. على سبيل المثال: "مصرف" (المؤسسة المالية مقابل ضفة النهر) يمكن أن تقود إلى نتائج غير ذات صلة.
- قد يؤدي البحث في النص الكامل إلى إخراج نتائج قد تحتوي على الكلمات الرئيسية ولكن لا تتوافق مع هدف المستخدم.
البحث الدلالي هو أسلوب لتحسين دقة البحث من خلال التركيز على الجوانب الرئيسية التالية:
- هدف المستخدم من البحث: يحاول فهم سبب بحث المستخدم في شيء ما. ما الذي يحاولون العثور عليه أو تحقيقه؟
- المعنى السياقي: يفسر الكلمات والعبارات بالنسبة إلى للنص المحيط، إلى جانب عوامل أخرى مثل الموقع الجغرافي للمستخدم أو طلب البحث السجل.
- العلاقة بين المفاهيم: يستخدم البحث الدلالي الرسوم البيانية للمعرفة (كبيرة وشبكات الكيانات ذات الصلة) ومعالجة اللغة الطبيعية لفهم كيفية ارتباط الكلمات والأفكار.
ونتيجة لذلك، عندما تنشئ أدوات باستخدام البحث الدلالي، يعتمد ناتج البحث عن الغرض العام من طلب البحث، بدلاً من الكلمات الرئيسية. هذا يعني أن الأداة يمكنها تحديد المستندات ذات الصلة، حتى في حالة عدم وجود الكلمة الرئيسية نفسها. مُمْكِنْ أن نتجنّب أيضًا النتائج التي تتضمّن الكلمة ولكن يكون لها معنى مختلف.
يمكنك في الوقت الحالي تنفيذ أداتَي بحث تستخدمان البحث الدلالي: Vertex AI Search Algolia AI Search:
سحب إجابات من المحتوى المنشور
لقد تعلّمت كيفية استخدام هندسة الطلبات ليتمكّن النموذج اللغوي الكبير من تقديم الإجابات. مرتبطة بمحتوى لا يظهر أبدًا من خلال إضافة سياق إلى المطالبة وقد تعلمنا كيفية توسيع نطاق هذا المنهج من المقالات الفردية إلى مجموعة كاملة من المحتوى باستخدام الجيل الاسترجاعي (RAG) . لقد تعلمت كيف يمكن للبحث الدلالي أن تحسّن النتائج للمستخدمين استعلامات البحث، تنفيذ RAG بشكل أفضل في منتجك.
إنها مشكلة معروفة يمكن أن تؤديها أدوات الذكاء الاصطناعي التوليدي إلى "الهلوسة". مما يجعل في أحسن الأحوال، أو غير موثوقة في بعض الأحيان، أو في أسوأ الأحوال، تضرّ بشكل نشط للأعمال. وباستخدام هذه الأساليب، يمكن لكل من المستخدمين والمطورين تحسين والموثوقية، وربما بناء الثقة في النتائج التي تحصل عليها من هذه التطبيقات.