खोज की सुविधा कैसे काम करती है

लिज़ी हार्वे
लिज़ी हार्वे

सर्च इंजन क्या करता है?

सर्च इंजन, किसी लाइब्रेरियन के डिजिटल वर्शन होते हैं. वे किसी क्वेरी के लिए सही जानकारी खोजने में मदद के लिए पूरी जानकारी वाले इंडेक्स का इस्तेमाल करते हैं. खोज की बुनियादी बातों को समझने से, आपको कॉन्टेंट को उपयोगकर्ताओं के लिए खोजने लायक बनाने में मदद मिलती है.

क्रॉलर वेब को कैसे ब्राउज़ करते हैं

क्रॉल करना, लाइब्रेरी में मौजूद सभी किताबों को पढ़ने जैसा है. इससे पहले कि सर्च इंजन कोई भी खोज नतीजे ला सकें, उन्हें वेब से ज़्यादा से ज़्यादा जानकारी हासिल करनी होगी. ऐसा करने के लिए, सर्च इंजन एक क्रॉलर का इस्तेमाल करते हैं. यह एक ऐसा प्रोग्राम है जो एक साइट से दूसरी साइट पर जाता है और ब्राउज़र की तरह काम करता है.

अगर कोई किताब या दस्तावेज़ मौजूद नहीं है या खराब हो गया है, तो क्रॉलर उसे पढ़ नहीं सकता. दस्तावेज़ के स्टेटस का पता लगाने के लिए, क्रॉलर हर यूआरएल को फ़ेच करने की कोशिश करते हैं. अगर किसी दस्तावेज़ में गड़बड़ी वाला स्टेटस कोड दिखता है, तो क्रॉलर उस कॉन्टेंट का इस्तेमाल नहीं कर सकते. साथ ही, वे यूआरएल को बाद में प्रोसेस करने की कोशिश कर सकते हैं. इससे यह पक्का होता है कि सार्वजनिक तौर पर ऐक्सेस किए जा सकने वाले दस्तावेज़ ही इंडेक्स में शामिल हों.

अगर क्रॉलर को रीडायरेक्ट करने वाला स्टेटस कोड (जैसे कि 301 या 302) मिलता है, तो वे नए यूआरएल पर रीडायरेक्ट करते हैं और उस पर चले जाते हैं. रिस्पॉन्स मिलने के बाद, यानी कि दस्तावेज़ मिल जाता है. उपयोगकर्ता इस दस्तावेज़ को ऐक्सेस कर सकते हैं. इसके बाद, वे यह जांच करते हैं कि उस दस्तावेज़ को क्रॉल किया जा सकता है या नहीं. इसके बाद, वह कॉन्टेंट डाउनलोड करता है.

इस जांच में एचटीएमएल और उसमें मौजूद सारा कॉन्टेंट शामिल होता है, जैसे कि इमेज, वीडियो या JavaScript. क्रॉलर, एचटीएमएल दस्तावेज़ों से भी लिंक निकाल सकते हैं, ताकि क्रॉलर भी लिंक किए गए यूआरएल पर जा सके. इन लिंक का इस्तेमाल करके, क्रॉलर वेब पर नए पेज खोजते हैं.

क्रॉलर सक्रिय रूप से लिंक या बटन पर क्लिक नहीं करते हैं, बल्कि बाद में उन्हें क्रॉल करने के लिए यूआरएल को सूची में भेजते हैं. किसी नए यूआरएल को ऐक्सेस करते समय, कोई कुकी, सर्विस वर्कर या लोकल स्टोरेज (जैसे कि IndexedDB) उपलब्ध नहीं होता.

इंडेक्स बनाना

किसी दस्तावेज़ को वापस पाने के बाद, क्रॉलर उस कॉन्टेंट को सर्च इंजन को देता है, ताकि उसे इंडेक्स में जोड़ा जा सके. सर्च इंजन अब कॉन्टेंट को रेंडर करके उसका विश्लेषण करता है, ताकि उसे समझा जा सके. रेंडर करने का मतलब है, पेज को ब्राउज़र की तरह दिखाना (कुछ शर्तों के साथ).

सर्च इंजन कीवर्ड, टाइटल, लिंक, हेडिंग, टेक्स्ट, और कई दूसरी चीज़ों को देखता है. इन्हें सिग्नल कहा जाता है. इनसे पेज के कॉन्टेंट और कॉन्टेक्स्ट के बारे में पता चलता है. सिग्नल की मदद से सर्च इंजन, किसी क्वेरी का जवाब सबसे सही पेज पर दे पाते हैं.

सर्च इंजन को अलग-अलग यूआरएल पर एक जैसा कॉन्टेंट मिल सकता है. उदाहरण के लिए, "ऐपल पाई" की कोई रेसिपी /recipes/apple-pie और /recipes/1234 से कम में मिल सकती है. इंडेक्स करने और रेसिपी को दो बार दिखाने से बचने के लिए, सर्च इंजन यह तय करते हैं कि मुख्य यूआरएल क्या होना चाहिए और वही कॉन्टेंट दिखाने वाले वैकल्पिक यूआरएल को खारिज कर दें.

सबसे उपयोगी नतीजे दिखाना

सर्च इंजन, इंडेक्स में क्वेरी को सिर्फ़ कीवर्ड से मैच करने के बजाय, ज़्यादा काम करते हैं. मददगार नतीजे देने के लिए, वे संदर्भ, वैकल्पिक शब्दों, उपयोगकर्ता की जगह की जानकारी वगैरह को ध्यान में रखते हैं. उदाहरण के लिए, "सिलिकॉन वैली" का मतलब भौगोलिक क्षेत्र या टीवी शो से हो सकता है. हालाँकि, अगर क्वेरी "silicon Valley Cast" में है, तो इस इलाके के नतीजे ज़्यादा मददगार नहीं होंगे.

कुछ क्वेरी सीधे तौर पर नहीं बताई जाती हैं, जैसे कि "पल्प फ़िक्शन का गाना". सर्च इंजन को इसे समझने और फ़िल्म में संगीत के नतीजे दिखाने की ज़रूरत होती है. जब कोई उपयोगकर्ता किसी चीज़ को खोजता है, तो सर्च इंजन सबसे काम के नतीजे तय करते हैं और फिर उन्हें उपयोगकर्ता को दिखाते हैं. पेजों को क्वेरी के आधार पर रैंक या क्रम में लगाया जाता है. बेहतर जानकारी उपलब्ध होने पर, यह क्रम अक्सर समय के साथ बदल सकता है.

अगले चरण: सर्च इंजन के लिए अपने विज्ञापन ऑप्टिमाइज़ करने का तरीका

अब जबकि आपने सर्च इंजन के काम करने के तरीके की बुनियादी बातों को समझ लिया है, तो आपको सर्च इंजन के लिए ऑप्टिमाइज़ करने से जुड़ी जानकारी दिख सकती है. इसे एसईओ या 'सर्च इंजन ऑप्टिमाइज़ेशन' कहा जाता है. यह पक्का करके कि सर्च इंजन आपका कॉन्टेंट ढूंढ सकें और अपने-आप समझ सकें, इससे काम की खोजों में आपकी साइट बेहतर तरीके से दिखेगी. इससे आपकी साइट में दिलचस्पी रखने वाले ज़्यादा लोग आ सकते हैं. Lighthouse के साथ अपनी साइट को ऑडिट करें और एसईओ के नतीजे देखें और जानें कि सर्च इंजन कितने अच्छे तरीके से उपयोगकर्ताओं को आपके कॉन्टेंट की जानकारी दे सकते हैं.