अपनी साइट खोज को अपग्रेड करें: जनरेटिव एआई की मदद से, काम के जवाब पाएं

जनरेटिव एआई का मतलब है, आर्टिफ़िशियल इंटेलिजेंस का इस्तेमाल करके नया कॉन्टेंट बनाने के लिए. जैसे, टेक्स्ट, इमेज, संगीत, ऑडियो, और वीडियो. जनरेटिव एआई, मशीन लर्निंग (एमएल) मॉडल का इस्तेमाल करके, इंसानों के बनाए कॉन्टेंट के डेटासेट में पैटर्न और संबंधों को सीखने में मदद करता है.

Gemini जैसे ऐप्लिकेशन की मदद से, इस टेक्नोलॉजी ने कई शानदार क्षमताएं दिखाई हैं. आप सोच रहे होंगे कि मैं अपने वेब प्रॉडक्ट में जनरेटिव एआई टूल को कैसे लागू करूं?

इसका एक सामान्य उदाहरण यह है कि उपयोगकर्ताओं को वेबसाइट के कॉन्टेंट के बारे में सवाल पूछने के लिए एक बेहतर इंटरफ़ेस दिया जाए. मशीन लर्निंग की मदद से, उपयोगकर्ता के खोज नतीजों को बेहतर बनाया जा सकता है.

एक ऐसा इंटरफ़ेस बनाया जा सकता है जिसमें लोग अपने सवाल लिखते हैं. इसके बाद, इसे Gemini जैसे बड़े लैंग्वेज मॉडल (एलएलएम) को भेजा जाता है. इसके बाद, उपयोगकर्ताओं को जवाब दिखाए जाते हैं.

मान लीजिए कि इस साइट पर ऐसी सुविधा मौजूद है. उपयोगकर्ता यह जानना चाहता है कि इंटरऑप 2024 में कौनसे एपीआई शामिल हैं और वह यह क्वेरी डालता है:

What are the features included in Interop 24?

माफ़ करें, कई वजहों से आउटपुट गलत हो सकता है:

  • लोगों ने किसी सवाल के लिए एलएलएम से जुड़ी जानकारी दी हो. इसलिए, एलएलएम से ग़लत जवाब या ग़लत जानकारी मिलने की संभावना बढ़ जाती है.
  • ऐसा हो सकता है कि इंटरऑप 2024 बनने से पहले एलएलएम को ट्रेनिंग दी गई हो या इसकी सुविधाओं का फ़ैसला हो चुका हो. इसलिए, इसे इस जानकारी के बारे में जानकारी नहीं है.

एलएलएम को नई जानकारी मिल सकती है, लेकिन एलएलएम ट्रेनिंग डेटासेट मूल रूप से पुराने हैं. नए नतीजे बनाए रखने में बहुत समय लग सकता है और यह महंगा हो सकता है.

प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करना

प्रॉम्प्ट इंजीनियरिंग, एलएलएम से सबसे अच्छा आउटपुट पाने के लिए तकनीकों का एक सेट है.

एक तकनीक है, प्रॉम्प्ट में ज़्यादा जानकारी देनी होती है. इससे एलएलएम में, कॉन्टेक्स्ट से मिलता-जुलता कॉन्टेंट मिलने की संभावना बढ़ जाती है.

अपने इंटरऑप उदाहरण को जारी रखते हुए, हमारा पहला कदम है, संदर्भ के तौर पर लेख का पूरा कॉन्टेंट उपलब्ध कराना. इसके बाद, एलएलएम के लिए इनपुट के तौर पर इस सवाल को जोड़ें. उदाहरण के लिए:

Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)

Input:
What are the features included in Interop 2024?

Gemini से कुछ ऐसा उम्मीद की जा सकती है:

The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL

यह जवाब, बिना कॉन्टेक्स्ट वाले सवाल के जवाब से बेहतर है, क्योंकि यह दिए गए कॉन्टेक्स्ट पर आधारित है.

आरएजी की मदद से पहुंच बढ़ाएं

उदाहरण के लिए, हम चाहते हैं कि एलएलएम किसी एक लेख से जुड़े सवाल का जवाब देने के बजाय, web.dev से जुड़े और सवालों के जवाब दे. इसके लिए, एलएलएम किसी लेख को अतिरिक्त संदर्भ के तौर पर इस्तेमाल करेगा. Gemini 1.5 की कॉन्टेक्स्ट विंडो के हिसाब से, छोटी साइटों के लिए ऐसा किया जा सकता है. हालांकि, बड़े प्रॉम्प्ट धीमे और ज़्यादा महंगे होते हैं.

एलएलएम इनपुट और आउटपुट लंबाई को टोकन में मापा और चार्ज किया जाता है. यह टेक्स्ट इनपुट में मिलने वाले वर्णों के एक सामान्य क्रम को दिखाने का तरीका है. टोकन की संख्या, आम तौर पर शब्दों की संख्या से ज़्यादा होगी. उदाहरण के तौर पर, पहले उदाहरण में दिए गए इनपुट में 775 शब्द थे, जिन्हें 1097 टोकन से दिखाया गया था. अलग-अलग एलएलएम, अलग-अलग तरीके से टोकन का हिसाब लगा सकते हैं. ज़्यादातर एलएलएम, टेक्स्ट इनपुट के लिए टोकन की संख्या का हिसाब लगाने के लिए, एपीआई या एंडपॉइंट उपलब्ध कराते हैं.

इसका एक समाधान है, एलएलएम से जुड़े प्रॉम्प्ट वाले लेख उपलब्ध कराना. इस टास्क को दो हिस्सों में बांटा जाना चाहिए:

  1. एलएलएम के लिए प्रॉम्प्ट करते समय, कॉन्टेक्स्ट के तौर पर सबसे ज़्यादा पढ़े जाने वाले लेखों का कॉन्टेंट जोड़ें.
  2. "इंटरऑप 2024 में कौनसी सुविधाएं शामिल हैं?" से जुड़े लेखों के लिए कॉन्टेंट खोजें.

हम चाहते हैं कि Gemini के नतीजे, इन लेखों के आधार पर दिखाए जाएं:

इनपुट ऐसा दिखना चाहिए:

Context:
Article 1:
Over the past two years... (trimmed)

Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)

Article 3:
Following on from the success of Interop 2022... (trimmed)

Input:
What are the features included in Interop 2024?

इस कॉन्टेक्स्ट से हमें अपनी उम्मीद के मुताबिक नतीजे मिलते हैं.

* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL

जो लोग एआई की तकनीकों के बारे में जानते हैं उनके लिए यह तरीका RAG का इस्तेमाल करता है. यह जनरेटिव एआई टूल से सही जवाबों की संभावना को बढ़ाने के लिए एक आम तरीका है.

आरएजी तकनीक सामान्य तौर पर पूरे टेक्स्ट की खोज के साथ काम कर सकती है, लेकिन इस तरीके में कुछ कमियां हैं.

  • पूरे टेक्स्ट की खोज करने की सुविधा से, एआई (AI) को सटीक कीवर्ड मैच खोजने में मदद मिलती है. हालांकि, एलएलएम को यह पता नहीं होता कि उपयोगकर्ता की क्वेरी का क्या मतलब है. इस वजह से, हो सकता है कि आउटपुट अधूरे हों या गलत हों.
  • शब्दों के एक से ज़्यादा मतलब होने या क्वेरी में एक जैसे मतलब वाले शब्दों का इस्तेमाल करने में समस्याएं हो सकती हैं. उदाहरण के लिए, "बैंक" (वित्तीय संस्थान बनाम रिवरबैंक) से काम न आने वाले नतीजे मिल सकते हैं.
  • पूरे टेक्स्ट की खोज से ऐसे नतीजे मिल सकते हैं जिनमें कीवर्ड शामिल हों, लेकिन वे उपयोगकर्ता के मकसद से मेल न खाते हों.

सेमैंटिक सर्च, एक ऐसी तकनीक है जिसकी मदद से, खोज को ज़्यादा सटीक बनाने के लिए, इन अहम पहलुओं पर ध्यान दिया जाता है:

  • सर्च करने वाले का इंटेंट: वह यह समझने की कोशिश करता है कि कोई उपयोगकर्ता कुछ क्यों खोज रहा है. वे क्या ढूंढने या हासिल करने की कोशिश कर रहे हैं?
  • संदर्भ के हिसाब से मतलब: इसमें शब्दों और वाक्यांशों की व्याख्या उनके आस-पास के टेक्स्ट से जुड़ी होती है. साथ ही, उपयोगकर्ता की जगह की जानकारी या खोज इतिहास जैसे अन्य फ़ैक्टर का भी पता चलता है.
  • कॉन्सेप्ट का आपस में संबंध: सिमैंटिक सर्च, नॉलेज ग्राफ़ (मिलते-जुलते इकाइयों के बड़े नेटवर्क) और नैचुरल लैंग्वेज प्रोसेसिंग का इस्तेमाल करके यह समझने में मदद करता है कि शब्द और आइडिया कैसे जुड़े हैं.

ऐसे में, जब सिमैंटिक खोज वाले टूल बनाए जाते हैं, तो खोज आउटपुट कीवर्ड के बजाय क्वेरी के मकसद पर निर्भर करता है. इसका मतलब है कि टूल काम के दस्तावेज़ तय कर सकता है. भले ही, सटीक कीवर्ड मौजूद न हो. यह उन नतीजों को भी रोक सकता है, जहां शब्द मौजूद है, लेकिन उसका मतलब अलग है.

फ़िलहाल, सिमैंटिक खोज का इस्तेमाल करने वाले दो सर्च टूल का इस्तेमाल किया जा सकता है: Vertex AI Search और Algolia AI Search.

पब्लिश किए गए कॉन्टेंट से जवाब ड्रॉ करें

आपने प्रॉम्प्ट में कॉन्टेक्स्ट जोड़कर, एलएलएम से जुड़े सवालों के जवाब देने के लिए प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करना सीख लिया है. आपने सीखा कि इस तरीके को अलग-अलग लेखों से कॉन्टेंट के पूरे कलेक्शन तक कैसे पहुंचाना है. इसके लिए, रिट्रीवल-ऑगमेंटेड जनरेशन (आरएजी) तकनीक का इस्तेमाल करें. आपने जाना कि कैसे सिमैंटिक खोज, उपयोगकर्ता की खोज क्वेरी के नतीजों को और बेहतर बना सकती है. साथ ही, आपने प्रॉडक्ट में आरएजी को बेहतर तरीके से लागू किया है.

यह एक जानी-पहचानी समस्या है कि जनरेटिव एआई टूल "गलत जानकारी" दे सकते हैं. इस वजह से ये सबसे अच्छे, कभी-कभी गैर-भरोसेमंद या सबसे खराब रूप से कारोबार के लिए नुकसानदेह बना देते हैं. इन तकनीकों का इस्तेमाल करके, उपयोगकर्ता और डेवलपर, दोनों ही इन ऐप्लिकेशन से मिलने वाले आउटपुट में विश्वसनीयता बनाने के लिए, विश्वसनीयता बना सकते हैं.