जनरेटिव एआई: नया कॉन्टेंट बनाना

अनुमान लगाने वाला एआई, मौजूदा डेटा से अहम जानकारी निकालता है. वहीं, जनरेटिव एआई एक कदम आगे बढ़कर कुछ नया बनाता है. यह टेक्स्ट लिख सकता है, इमेज जनरेट कर सकता है, कोड बना सकता है या पूरे यूज़र इंटरफ़ेस को डिज़ाइन भी कर सकता है. जनरेटिव एआई के इस्तेमाल के कुछ सामान्य उदाहरण यहां दिए गए हैं:

  • कॉन्टेंट बनाना: एआई की मदद से लिखने वाले असिस्टेंट, ड्राफ़्ट बना सकते हैं और मौजूदा टेक्स्ट को बेहतर बना सकते हैं.
  • खास जानकारी: Google की एआई की मदद से मिली जानकारी जैसे टूल, लंबे दस्तावेज़ों, मीटिंग या वेब पेजों को छोटा करके, काम की खास जानकारी में बदल देते हैं.
  • कोड जनरेट करना: डेवलपर टूल, जनरेटिव एआई का इस्तेमाल करके कोड लिखते और उसे फिर से बनाते हैं. इससे डेवलपर की प्रॉडक्टिविटी बढ़ती है.
  • इमेज और ऐसेट बनाना: विज़न मॉडल का इस्तेमाल करके, उपयोगकर्ता विज़ुअल ऐसेट बना सकते हैं. जैसे, बैनर और थंबनेल.

जनरेटिव एआई लूप

ज़्यादातर जनरेटिव एआई मॉडल को न्यूरल नेटवर्क और ट्रांसफ़ॉर्मर आर्किटेक्चर का इस्तेमाल करके ट्रेन किया जाता है. मॉडल, किसी क्रम में मौजूद पिछले एलिमेंट के आधार पर, अगले एलिमेंट का सुझाव देना सीखते हैं. जैसे, पिछले शब्द के आधार पर अगले शब्द का सुझाव देना, पिछले पिक्सल के आधार पर अगले पिक्सल का सुझाव देना या पिछले नोट के आधार पर अगले नोट का सुझाव देना.

गणित के हिसाब से, यह अनुमान लगाने वाले एआई से ज़्यादा अलग नहीं है. दोनों, डेटा से पैटर्न सीखते हैं. अंतर स्केल में है.

अनुमान लगाने वाले एआई में, आउटपुट के विकल्प कुछ लेबल तक सीमित होते हैं. जैसे, "छोड़ दिया" या "नहीं छोड़ा." जनरेटिव एआई में, आउटपुट स्पेस में लाखों विकल्प शामिल हो सकते हैं. इसे अरबों उदाहरणों के आधार पर ट्रेन किया गया है. इसलिए, अनुमान लगाने का इसका तरीका एक शक्तिशाली इंजन के तौर पर विकसित होता है. यह ऐसे नए आउटपुट जनरेट कर सकता है जो पहले कभी नहीं देखे गए.

जनरेटिव एआई सिस्टम को बार-बार बेहतर बनाया जाता है.

हर चरण, अगले चरण की ओर इशारा करता है. यह एक लगातार चलने वाला सर्कल है.
पहली इमेज. अनुमान लगाने वाले एआई लूप की तरह ही, आपको सबसे पहले यह तय करना होगा कि आपको इसका इस्तेमाल किस काम के लिए करना है. लूप हर चरण से होकर गुज़रता है और फिर से शुरू हो जाता है.

हम आपको अपने सैंपल ऐप्लिकेशन, BlogBuddy के साथ इसके काम करने का तरीका बताएंगे. यह कॉन्टेंट मैनेजमेंट सिस्टम असिस्टेंट है. यह उपयोगकर्ताओं को दिलचस्प ब्यौरे जनरेट करने और एसईओ के लिहाज़ से बेहतर लेख के टाइटल बनाने में मदद करता है.

तय करें कि आपको डेटा का इस्तेमाल किस काम के लिए करना है

BlogBuddy के एआई सिस्टम का ब्लूप्रिंट.
दूसरी इमेज. Blogbuddy ऐप्लिकेशन के लिए, आपके सिस्टम का ब्लूप्रिंट. पूरे साइज़ का डायग्राम खोलें.

समस्या के बारे में जानकारी देते समय, यह जानकारी शामिल करें:

  • इनपुट और आउटपुट का तरीका. यह टेक्स्ट (गद्य या कोड), इमेज या ऑडियो के रूप में हो सकता है.
  • इनपुट का तरीका. क्या कॉन्टेंट को अपलोड फ़ील्ड, फ़्री टेक्स्ट या अन्य स्ट्रक्चर इनपुट से लिया गया है?
  • दर्शक. यह टास्क कौन पूरा कर रहा है? क्या उन्हें सामान्य जानकारी है या उन्हें किसी खास विषय के बारे में जानकारी चाहिए?

BlogBuddy की सुविधाएं, टेक्स्ट जनरेट करने के लिए उपलब्ध हैं. इनपुट सेमी-स्ट्रक्चर्ड होता है: उपयोगकर्ता कोई विषय या छोटा ड्राफ़्ट देते हैं और मॉडल अलग-अलग वर्शन दिखाता है. ऑडियंस मार्केटिंग से जुड़ी है और उसे संपादकीय के बारे में खास जानकारी है.

अपने आउटपुट के लिए क्वालिटी स्टैंडर्ड सेट करना ज़रूरी है. हमें ऐसा टेक्स्ट जनरेट करना है जो छोटा हो, जिसे आसानी से पढ़ा जा सके, और जिसमें कीवर्ड शामिल हों. साथ ही, वह पब्लिकेशन की टोन के हिसाब से हो.

सफलता से जुड़ी मेट्रिक तय करने से, आपको आगे की प्रोसेस को सही तरीके से मैनेज करने में मदद मिलती है. डेटा के आधार पर डेवलपमेंट में, आपको सक्सेस मेट्रिक इकट्ठा करने के बारे में ज़्यादा जानकारी मिलेगी.

बेस मॉडल चुनें

कई ऐसे मॉडल उपलब्ध हैं जिन्हें बड़े और सामान्य डेटा सेट पर पहले से ही ट्रेन किया गया है. इनके व्यवहार को खास ज़रूरतों के हिसाब से बदला जा सकता है. जनरेटिव एआई मॉडल, अनुमान लगाने वाले मॉडल की तुलना में ज़्यादा बड़े और जटिल होते हैं. इसलिए, हमारा सुझाव है कि आप किसी मौजूदा मॉडल का इस्तेमाल करें. अपना मॉडल बनाने और उसे ट्रेनिंग देने के बजाय, किसी मौजूदा मॉडल का इस्तेमाल करना बेहतर होता है.

आपके चुने गए विकल्प से, आपके प्रॉडक्ट की क्षमताओं, लागत, पसंद के मुताबिक बनाने की सुविधा, और निजता की सीमाओं का पता चलता है. मॉडल का चुनाव, इस बात पर काफ़ी हद तक निर्भर करता है कि आपने अपने एआई सिस्टम को किस प्लैटफ़ॉर्म पर डिप्लॉय किया है.

इस कोर्स में आगे चलकर, आपको अपना प्लैटफ़ॉर्म चुनने का तरीका बताया जाएगा.

प्रॉम्प्ट और कॉन्टेक्स्ट इंजीनियरिंग

मॉडल चुनने के बाद, आपको उसे प्रॉम्प्ट के साथ सही निर्देश देने होंगे. BlogBuddy के लिए, हम मॉडल को इस तरह प्रॉम्प्ट कर सकते हैं:

Generate three short, engaging title suggestions for this article

प्रॉम्प्ट में कई तरह की जानकारी जोड़ी जा सकती है. उदाहरण के लिए:

  • सिस्टम प्रॉम्प्ट, जो सामान्य व्यवहार सेट करता है.
  • मौजूदा टास्क के लिए, इनपुट के हिसाब से कॉन्टेक्स्ट.
  • बातचीत वाले ऐप्लिकेशन, जैसे कि चैटबॉट या एजेंट में उपयोगकर्ता के निर्देश.

अनुमान और पोस्ट-प्रोसेसिंग

प्रॉम्प्ट तैयार होने के बाद, इसे मॉडल को भेजा जाता है, ताकि वह अनुमान लगा सके. मॉडल के जवाब देने के तरीके को बेहतर बनाने के लिए, मॉडल के पैरामीटर बदले जा सकते हैं. इनमें क्रिएटिविटी के लिए तापमान और लंबाई और शब्दों की संख्या के लिए टोकन की ज़्यादा से ज़्यादा संख्या शामिल है. जवाब जनरेट होने के बाद, अक्सर अतिरिक्त नियमों और सुरक्षा निर्देशों के हिसाब से उसकी जांच की जाती है.

उदाहरण के लिए, लिंग के हिसाब से लिखे गए टेक्स्ट को फिर से लिखा जा सकता है, टोन को बेहतर बनाया जा सकता है या प्रतिबंधित शब्दों को फ़िल्टर किया जा सकता है.

पारदर्शिता और भरोसेमंद कैलिब्रेशन को बेहतर बनाने के लिए, किसी छोटे और सेकंडरी मॉडल को जोड़ा जा सकता है. इससे, नतीजे को कैटगरी में बांटा जा सकता है या उसका खास जानकारी दी जा सकती है. उदाहरण के लिए: "जवाब, मिलते-जुलते 12 लेखों से जनरेट किया गया है. कॉन्फ़िडेंस लेवल: ज़्यादा."

आकलन और फ़ीडबैक लूप

जनरेटिव एआई के लिए आउटपुट स्पेस काफ़ी बड़ा होता है. इसलिए, ज़्यादातर प्रॉम्प्ट के लिए एक सही जवाब नहीं होता. स्टैंडर्ड बेंचमार्क, जैसे कि MMLU या SQuAD, मॉडल की सामान्य क्षमता का आकलन कर सकते हैं. हालांकि, ये इंसानों की खास ज़रूरतों को शायद ही पूरा कर पाते हैं. प्रॉडक्ट के संदर्भ में, आपको क्वालिटी और संख्या से जुड़ी मेट्रिक का अपना मिक्स तय करना होगा:

  • सटीकता: क्या जवाब में दिए गए तथ्य सही हैं?
  • मददगार होना: क्या जवाब, प्रॉम्प्ट में बताई गई उम्मीदों या उपयोगकर्ता के मकसद के मुताबिक है?
  • पढ़ने में आसानी और भाषा शैली: क्या आउटपुट साफ़ तौर पर समझ में आ रहा है और ब्रैंड के मानकों के मुताबिक है?
  • मैन्युअल तरीके से किया गया काम: मैन्युअल तरीके से कॉन्टेंट में कितना बदलाव किया गया है या उसे कितना व्यवस्थित किया गया है?
  • डोमेन की जानकारी: क्या जवाब में डोमेन से जुड़ी जानकारी शामिल है?

इन मेट्रिक का आकलन करने के लिए, मैन्युअल तरीके से समीक्षा करने और ऑटोमेटेड स्कोरिंग को एक साथ इस्तेमाल किया जा सकता है. उदाहरण के लिए, उपयोगकर्ताओं से रीयल-लाइफ़ आउटपुट को रेटिंग देने के लिए कहा जा सकता है. साथ ही, अपने-आप होने वाले आकलन के लिए दूसरे मॉडल का इस्तेमाल किया जा सकता है. इसे LLM-as-a-judge भी कहा जाता है. इसके अलावा, पक्षपात या गलत जानकारी से बचने के लिए, समय-समय पर इंटरनल समीक्षाएं की जा सकती हैं.

जनरेटिव एआई का इस्तेमाल करके कुछ बनाने के दौरान, इस्तेमाल से जुड़ा असली डेटा आपकी सबसे बड़ी ऐसेट में से एक होता है. अगर हो सके, तो इन इंटरैक्शन को लॉग करें. इससे आपको प्रॉम्प्ट और कॉन्टेक्स्ट में बदलाव करने, अलग-अलग मॉडल को आज़माने या समय के साथ पैरामीटर को अडजस्ट करने में मदद मिलेगी. उपयोगकर्ता के हर इंटरैक्शन, सुधार या रेटिंग को सुझाव, राय या शिकायत माना जाता है. इससे आपको ऑप्टिमाइज़ेशन के अगले चरण तय करने में मदद मिल सकती है:

  • उपयोगकर्ता के अनचाहे इनपुट से, यह पता लगाया जा सकता है कि क्या सही समस्या को हल किया जा रहा है.
  • बार-बार किए जाने वाले डोमेन से जुड़े अनुरोधों से, मॉडल चुनने में मदद मिल सकती है. आपके पास बड़े और सामान्य एलएलएम से छोटे और बेहतर तरीके से काम करने वाले मॉडल पर स्विच करने का विकल्प होता है.
  • बार-बार भ्रमित करने वाली जानकारी मिलने से पता चलता है कि आपके प्रॉम्प्ट में खास संदर्भ की कमी है.
  • बहुत ज़्यादा बदलाव करने से, शेयर किए गए कॉन्टेक्स्ट के काफ़ी न होने का पता चल सकता है. मॉडल को उस जानकारी के बारे में पता नहीं है जिसे उपयोगकर्ता सामान्य जानकारी मानता है.

समय के साथ, ये फ़ीडबैक लूप आपकी जनरेटिव एआई सुविधा को स्टैटिक मॉडल कॉल से बदलकर, एक ऐसे सिस्टम में बदल देते हैं जो लगातार आपके उपयोगकर्ताओं की ज़रूरतों और प्राथमिकताओं के हिसाब से काम करता है.

आम तौर पर होने वाली गलतियां और उन्हें ठीक करने के तरीके

जनरेटिव एआई, इनपुट और आउटपुट के लिए एक ओपन-एंडेड स्पेस में काम करता है. इसलिए, इसमें जोखिम की संभावना, अनुमान लगाने वाले सिस्टम की तुलना में काफ़ी ज़्यादा होती है. यह सिर्फ़ गलत जवाब नहीं देता, बल्कि आपत्तिजनक, पक्षपात वाला या गुमराह करने वाला कॉन्टेंट भी जनरेट कर सकता है. इसके अलावा, यह अनजाने में उपयोगकर्ताओं को गुमराह भी कर सकता है. इन वजहों से, लोगों का भरोसा कम हो सकता है. साथ ही, आपकी कंपनी पर वित्तीय या कानूनी असर पड़ सकता है.

इसलिए, जनरेटिव एआई के लिए, जोखिम को पहले से ही मैनेज करने का तरीका अपनाना ज़रूरी है. यहां कुछ सामान्य जोखिमों के बारे में बताया गया है:

  • गलत जानकारी: मॉडल तथ्यों को मनगढ़ंत तरीके से पेश करता है या जानकारी को गलत तरीके से बताता है. इस समस्या को कम करने के लिए, तथ्यों के आधार पर जवाब देने के लिए RAG का इस्तेमाल करें.
  • ज़्यादा भरोसा करना: उपयोगकर्ता यह मान लेते हैं कि एआई से मिले जवाब हमेशा सही होते हैं. समस्या कम करने के लिए, समीक्षा करने और बदलाव करने के फ़्लो को बढ़ावा दें. अपने-आप पब्लिश होने की सुविधा का इस्तेमाल न करें. एआई गवर्नेंस: ज़िम्मेदारी के साथ एआई बनाना में, आपको यह जानने को मिलेगा कि उपयोगकर्ताओं को एआई पर भरोसा करने के लिए कैसे तैयार किया जाए.
  • असंगति: अलग-अलग रन में आउटपुट में काफ़ी अंतर होता है. इस समस्या को कम करने के लिए, प्रॉम्प्ट टेंप्लेट, तापमान कंट्रोल या कुछ उदाहरणों का इस्तेमाल करके, टोन और स्ट्रक्चर को स्थिर करें.
  • नुकसान पहुंचाने वाला या आपत्तिजनक कॉन्टेंट: मॉडल, पक्षपात करने वाला, आपत्तिजनक या गलत जानकारी देने वाला टेक्स्ट जनरेट करता है. इसे कम करने के लिए, कॉन्टेंट दिखाने से पहले मॉडरेशन फ़िल्टर और ज़हरीले कॉन्टेंट का पता लगाने वाले क्लासिफ़ायर लागू करें. असल प्रॉम्प्ट का इस्तेमाल करके, आउटपुट की लगातार जांच करें. साथ ही, फ़ीडबैक लूप को चालू रखें, ताकि मुश्किल मामलों को फ़्लैग किया जा सके और उन पर फिर से ट्रेनिंग दी जा सके.
  • लेटेंसी और लागत: बड़े मॉडल धीमे और महंगे हो सकते हैं. खास तौर पर, अगर आपको बड़े पैमाने पर एआई को अपनाना है, तो मॉडल की लागत और संसाधन के इस्तेमाल का अनुमान लगाना मुश्किल हो सकता है. इस समस्या को कम करने के लिए, कैश मेमोरी, बैचिंग, और छोटे टास्क के लिए छोटे मॉडल का इस्तेमाल करें.

आपके लिए अहम जानकारी

संक्षेप में कहें, तो जनरेटिव एआई, रॉ आइडिया को टेक्स्ट, इमेज, कोड या बातचीत जैसे कॉन्टेंट में बदल देता है. यह उन कामों के लिए सबसे सही है जहां क्रिएटिविटी और अडैप्टेबिलिटी, सटीक जानकारी से ज़्यादा मायने रखती है.

वेब डेवलपर के तौर पर, आपकी सफलता इन बातों पर निर्भर करती है: सही प्रॉम्प्ट डिज़ाइन करना, अपने मॉडल को सही डेटा के आधार पर तैयार करना, और सिस्टम को लगातार उपयोगकर्ता की प्राथमिकताओं के हिसाब से अलाइन करना.

संसाधन

छोटे और टिकाऊ मॉडल चुनने के बारे में पढ़ें. ज़्यादा बेहतर तरीके से सीखने के लिए:

देखें कि आपको कितना समझ आया

जनरेटिव एआई और अनुमान लगाने वाले एआई के आउटपुट में क्या मुख्य अंतर है?

जनरेटिव एआई से मिले आउटपुट, "छोड़ दिया" या "नहीं छोड़ा" जैसे कुछ लेबल तक ही सीमित होते हैं.
गलत जवाब.
जनरेटिव एआई, विकल्पों के आउटपुट स्पेस (टेक्स्ट, पिक्सल, कोड) से नया कॉन्टेंट बनाता है.
बहुत बढ़िया, यह सही है!
जनरेटिव एआई का इस्तेमाल सिर्फ़ संख्या के हिसाब से अनुमान लगाने के लिए किया जाता है.
गलत जवाब.
जनरेटिव एआई, पैटर्न को समझने के लिए डेटा का इस्तेमाल नहीं करता.
गलत जवाब.

मॉडल के तापमान की क्या भूमिका होती है?

इससे मॉडल के जवाब में रैंडमनेस को कंट्रोल किया जाता है.
गलत जवाब.
इससे मॉडल के जवाब की क्रिएटिविटी को अडजस्ट किया जाता है.
बहुत बढ़िया, यह सही है!
यह प्रतिबंधित शब्दों को फ़िल्टर करके हटा देता है.
गलत जवाब.
इससे मॉडल की स्पीड बढ़ जाती है.
गलत जवाब.

जनरेटिव एआई का आकलन करने के लिए, स्टैंडर्ड बेंचमार्क अक्सर काफ़ी क्यों नहीं होते?

इन्हें चलाना बहुत महंगा होता है.
गलत जवाब.
ये इंसानों की खास ज़रूरतों और प्रॉडक्ट के इंटेंट को बहुत कम कैप्चर करते हैं.
बहुत बढ़िया, यह सही है!
ये सिर्फ़ इमेज जनरेट करने के लिए काम करते हैं, टेक्स्ट के लिए नहीं.
गलत जवाब.
आधुनिक मॉडल के लिए, इन सवालों के जवाब देना बहुत आसान है.
गलत जवाब.

इनमें से कौनसी तकनीक का इस्तेमाल, एआई के जवाबों में मौजूद तथ्यों के ग़लत होने की समस्या को कम करने के लिए किया जाता है?

तथ्यों के आधार पर जवाब देने के लिए, आरएजी (रीट्रिवल-ऑगमेंटेड जनरेशन) जैसी तकनीकों का इस्तेमाल करें.
बहुत बढ़िया, यह सही है!
मॉडल को ज़्यादा क्रिएटिव बनाने के लिए, उसके तापमान को बढ़ाएं.
गलत जवाब.
एआई का इस्तेमाल बंद करें और मैन्युअल तरीके से कॉन्टेंट बनाना शुरू करें.
ऐसा हो सकता है, लेकिन इससे मॉडल को ज़्यादा सटीक आउटपुट बनाने में मदद नहीं मिलती.
अगर आउटपुट संदिग्ध लगता है, तो उसे उपयोगकर्ता से छिपाएं.
उपयोगकर्ता को गलत जानकारी मिलने से रोकने की कोशिश की जा सकती है. हालांकि, इससे लगातार हो रही मतिभ्रम की समस्या ठीक नहीं होती.

जनरेटिव एआई के लूप के मुताबिक, आपको उपयोगकर्ता के सुझाव, शिकायत या राय के साथ क्या करना चाहिए?

निजता की सुरक्षा के लिए, इसे तुरंत मिटा दें.
गलत जवाब.
इसका इस्तेमाल समस्या की परिभाषा, मॉडल चुनने या प्रॉम्प्ट को बेहतर बनाने के लिए करें.
बहुत बढ़िया, यह सही है!
इसे किसी अलग डेटाबेस में सेव करें और कभी न देखें.
गलत जवाब.
इसका इस्तेमाल सिर्फ़ मॉडल को खराब परफ़ॉर्मेंस के लिए दंडित करने के लिए करें.
गलत जवाब.