अपनी साइट खोज को अपग्रेड करें: जनरेटिव एआई की मदद से, काम के जवाब पाएं

जनरेटिव एआई का मतलब है, आर्टिफ़िशियल इंटेलिजेंस का इस्तेमाल करके नया कॉन्टेंट बनाना. जैसे, टेक्स्ट, इमेज, संगीत, ऑडियो, और वीडियो. जनरेटिव एआई, मशीन लर्निंग (एमएल) मॉडल पर निर्भर करता है. इससे, यह लोगों के बनाए गए कॉन्टेंट के डेटासेट में पैटर्न और संबंधों को समझ पाता है.

इस टेक्नोलॉजी ने Gemini जैसे ऐप्लिकेशन के ज़रिए शानदार क्षमताएं दिखाई हैं. आपके मन में यह सवाल उठ रहा होगा कि मैं अपने वेब प्रॉडक्ट में जनरेटिव एआई टूल का इस्तेमाल कैसे करूं?

इसका एक सामान्य इस्तेमाल, उपयोगकर्ताओं को किसी वेबसाइट के कॉन्टेंट के बारे में सवाल पूछने के लिए बेहतर इंटरफ़ेस उपलब्ध कराना है. मशीन लर्निंग की मदद से, उपयोगकर्ताओं को खोज के बेहतर नतीजे दिखाए जा सकते हैं.

आपके पास ऐसा इंटरफ़ेस बनाने का विकल्प है जहां उपयोगकर्ता अपना सवाल लिखते हैं. इसके बाद, उस सवाल को Gemini जैसे लार्ज लैंग्वेज मॉडल (एलएलएम) को भेजा जाता है. इसके बाद, उपयोगकर्ताओं को जवाब दिखाए जाते हैं.

मान लें कि इस साइट पर ऐसी सुविधा मौजूद थी. किसी उपयोगकर्ता को यह जानना है कि Interop 2024 में कौनसे एपीआई शामिल हैं. इसके लिए, वह यह क्वेरी डालता है:

What are the features included in Interop 24?

माफ़ करें, कुछ वजहों से आउटपुट गलत हो सकता है:

  • उपयोगकर्ता ने एलएलएम को सवाल के बारे में बहुत कम जानकारी दी है. इसलिए, एलएलएम से ग़लत जवाब मिलने या ग़लत जानकारी मिलने की संभावना ज़्यादा है.
  • ऐसा हो सकता है कि एलएलएम को Interop 2024 के बनने या उसकी सुविधाओं के तय होने से पहले ट्रेन किया गया हो. इसलिए, यह उस जानकारी के बारे में नहीं जानता.

एलएलएम को ज़्यादा अप-टू-डेट जानकारी मिल सकती है. हालांकि, एलएलएम के ट्रेनिंग डेटासेट में मौजूद जानकारी पुरानी होती है. नए नतीजे पाने में काफ़ी समय और पैसा लग सकता है.

प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करें

प्रॉम्प्ट इंजीनियरिंग, एलएलएम से सबसे अच्छा आउटपुट पाने के लिए इस्तेमाल की जाने वाली तकनीकों का एक सेट है.

प्रॉम्प्ट में ज़्यादा जानकारी देने की एक तकनीक है. इससे एलएलएम, कॉन्टेक्स्ट से जुड़ा कॉन्टेंट दिखाने की संभावना ज़्यादा बढ़ा देता है.

इंटरऑपरेबिलिटी के उदाहरण को जारी रखते हुए, हमारा पहला चरण लेख का पूरा कॉन्टेंट, संदर्भ के तौर पर देना है. इसके बाद, सवाल को LLM के जवाब के तौर पर इनपुट के तौर पर जोड़ें. उदाहरण के लिए:

Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)

Input:
What are the features included in Interop 2024?

आपको Gemini से इस तरह का आउटपुट मिल सकता है:

The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL

बिना किसी संदर्भ के निर्देश देने की तुलना में यह जवाब ज़्यादा बेहतर हो सकता है, क्योंकि दिए गए संदर्भ पर आधारित जवाब दिया जाता है.

आरएजी की मदद से कारोबार को बढ़ाना

उदाहरण के लिए, हम चाहते हैं कि एलएलएम किसी एक लेख के बारे में सवाल के जवाब देने के बजाय, web.dev के बारे में ज़्यादा सवालों के जवाब दे. इसके लिए, वह किसी भी लेख का इस्तेमाल अतिरिक्त संदर्भ के तौर पर कर सकता है. हालांकि, यह छोटी साइटों के लिए मुमकिन है, लेकिन Gemini 1.5 की कॉन्टेक्स्ट-विंडो में 10 लाख टोकन होने की वजह से, बड़े प्रॉम्प्ट धीमे और ज़्यादा महंगे होते हैं.

एलएलएम के इनपुट और आउटपुट की लंबाई को टोकन में मेज़र किया जाता है और उन पर शुल्क लिया जाता है. टोकन, टेक्स्ट इनपुट में पाए जाने वाले वर्णों के सामान्य क्रम को दिखाने का एक तरीका है. आम तौर पर, टोकन की संख्या, शब्दों की संख्या से ज़्यादा होगी. उदाहरण के लिए, पहले उदाहरण में दिए गए इनपुट में 775 शब्द थे, जिन्हें 1,097 टोकन से दिखाया गया था. अलग-अलग एलएलएम, टोकन का हिसाब अलग-अलग तरीके से लगा सकते हैं. ज़्यादातर एलएलएम, टेक्स्ट इनपुट के लिए टोकन की संख्या का हिसाब लगाने के लिए एपीआई या एंडपॉइंट उपलब्ध कराते हैं.

एक तरीका यह है कि एलएलएम प्रॉम्प्ट से जुड़े लेख उपलब्ध कराएं. इस टास्क को दो हिस्सों में बांटना चाहिए:

  1. एलएलएम से अनुरोध करते समय, संदर्भ के तौर पर सबसे लोकप्रिय लेखों का कॉन्टेंट जोड़ें.
  2. "Interop 2024 में कौनसी सुविधाएं शामिल हैं?" से जुड़े लेख खोजें.

हम चाहते हैं कि Gemini के नतीजों में, इन लेखों के आधार पर कॉन्टेंट दिखे:

इनपुट इस तरह दिखना चाहिए:

Context:
Article 1:
Over the past two years... (trimmed)

Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)

Article 3:
Following on from the success of Interop 2022... (trimmed)

Input:
What are the features included in Interop 2024?

इस कॉन्टेक्स्ट से हमें उम्मीद के मुताबिक नतीजे मिलते हैं.

* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL

एआई की तकनीकों के बारे में जानने वाले लोगों के लिए, इस तरीके में आरएजी का इस्तेमाल किया जाता है. यह एक सामान्य तरीका है, जिससे जनरेटिव एआई टूल से असल जवाब पाने की संभावना बढ़ जाती है.

आरएजी तकनीक, सामान्य फ़ुल टेक्स्ट सर्च के साथ काम कर सकती है. हालांकि, इस तरीके में कुछ कमियां हैं.

  • पूरे टेक्स्ट में खोजने की सुविधा से, एआई को एग्ज़ैक्ट मैच वाले कीवर्ड ढूंढने में मदद मिलती है. हालांकि, एलएलएम, उपयोगकर्ता की क्वेरी के पीछे के सही मतलब का पता नहीं लगा पाते. इस वजह से, आउटपुट अधूरे या गलत हो सकते हैं.
  • शब्दों के एक से ज़्यादा मतलब होने पर या क्वेरी में समानार्थी शब्दों का इस्तेमाल होने पर समस्याएं हो सकती हैं. उदाहरण के लिए, "बैंक" (वित्तीय संस्थान बनाम नदी का किनारा) से काम के नतीजे नहीं मिल सकते.
  • फ़ुल टेक्स्ट सर्च से ऐसे नतीजे मिल सकते हैं जिनमें कीवर्ड शामिल हों, लेकिन वे उपयोगकर्ता के मकसद के मुताबिक न हों.

सेमांटिक सर्च एक ऐसी तकनीक है जिससे खोज के नतीजों को ज़्यादा सटीक बनाया जा सकता है. इसके लिए, इन अहम बातों पर ध्यान दिया जाता है:

  • खोज करने वाले व्यक्ति का इंटेंट: इससे यह समझने की कोशिश की जाती है कि कोई व्यक्ति किसी चीज़ को क्यों खोज रहा है. वे क्या खोज रहे हैं या क्या हासिल करना चाहते हैं?
  • कॉन्टेक्स्ट के हिसाब से शब्दों का मतलब: यह शब्दों और वाक्यांशों का मतलब, आस-पास के टेक्स्ट के साथ-साथ उपयोगकर्ता की जगह या खोज के इतिहास जैसे अन्य फ़ैक्टर के हिसाब से बताता है.
  • कॉन्सेप्ट के बीच का संबंध: सेमैनटिक सर्च, नॉलेज ग्राफ़ (मिलती-जुलती इकाइयों के बड़े नेटवर्क) और नैचुरल लैंग्वेज प्रोसेसिंग का इस्तेमाल करके यह समझता है कि शब्द और विचार कैसे जुड़े हैं.

इस वजह से, जब सिमैंटिक खोज वाले टूल बनाए जाते हैं, तो खोज आउटपुट, कीवर्ड के बजाय क्वेरी के मकसद पर निर्भर करता है. इसका मतलब है कि सटीक कीवर्ड न होने पर भी, टूल काम के दस्तावेज़ तय कर सकता है. इससे उन नतीजों को भी हटाया जा सकता है जिनमें शब्द मौजूद है, लेकिन उसका मतलब अलग है.

फ़िलहाल, आपके पास दो ऐसे खोज टूल लागू करने का विकल्प है जो सिमैंटिक सर्च का इस्तेमाल करते हैं: Vertex AI Search और Algolia AI Search.

पब्लिश किए गए कॉन्टेंट से जवाब बनाना

आपने प्रॉम्प्ट इंजीनियरिंग का इस्तेमाल करके, एलएलएम को ऐसे कॉन्टेंट से जुड़े जवाब देने का तरीका सीखा है जो प्रॉम्प्ट में कॉन्टेक्स्ट जोड़कर नहीं देखा गया है. साथ ही, आपने रिट्रिवल-ऑगमेंटेड जनरेशन (आरएजी) तकनीक का इस्तेमाल करके, इस तरीके को अलग-अलग लेखों से कॉन्टेंट के पूरे कॉर्पस तक बढ़ाने का तरीका भी जाना है. आपने जाना कि अपने प्रॉडक्ट में आरएजी को बेहतर तरीके से लागू करके, उपयोगकर्ता की खोज क्वेरी के लिए, सेमैटिक सर्च से नतीजों को और बेहतर कैसे बनाया जा सकता है.

यह एक आम समस्या है कि जनरेटिव एआई टूल "गलत जानकारी" दे सकते हैं. इस वजह से, कभी-कभी इन पर भरोसा नहीं किया जा सकता. इसके अलावा, इनसे कारोबार को नुकसान भी पहुंच सकता है. इन तकनीकों की मदद से, उपयोगकर्ता और डेवलपर, दोनों ही ऐप्लिकेशन के काम करने के तरीके को बेहतर बना सकते हैं. साथ ही, इन ऐप्लिकेशन के आउटपुट पर भरोसा भी बढ़ाया जा सकता है.