खोज की सुविधा कैसे काम करती है

सर्च इंजन क्या करता है?

सर्च इंजन, लाइब्रेरियन का डिजिटल वर्शन हैं. ये किसी क्वेरी के लिए सही जानकारी ढूंढने में मदद करने के लिए, एक बड़े इंडेक्स का इस्तेमाल करते हैं. खोज के बुनियादी सिद्धांतों को समझने से, उपयोगकर्ताओं को अपना कॉन्टेंट ढूंढने में मदद मिलती है.

क्रॉलर, वेब को कैसे ब्राउज़ करते हैं

क्रॉल करना, लाइब्रेरी में मौजूद सभी किताबें पढ़ने जैसा है. सर्च इंजन, खोज के नतीजे दिखाने से पहले, वेब से ज़्यादा से ज़्यादा जानकारी इकट्ठा करते हैं. ऐसा करने के लिए, सर्च इंजन किसी क्रॉलर का इस्तेमाल करते हैं. यह एक ऐसा प्रोग्राम है जो साइट से साइट पर जाता है और ब्राउज़र की तरह काम करता है.

अगर कोई किताब या दस्तावेज़ मौजूद नहीं है या खराब हो गया है, तो क्रॉलर उसे नहीं पढ़ सकता. क्रॉलर, दस्तावेज़ की स्थिति का पता लगाने के लिए हर यूआरएल को फ़ेच करने की कोशिश करते हैं. अगर कोई दस्तावेज़ गड़बड़ी का स्टेटस कोड दिखाता है, तो क्रॉलर उसके किसी भी कॉन्टेंट का इस्तेमाल नहीं कर सकते. हालांकि, वे बाद में यूआरएल को फिर से क्रॉल करने की कोशिश कर सकते हैं. इससे यह पक्का होता है कि इंडेक्स में सिर्फ़ ऐसे दस्तावेज़ शामिल किए जाएं जिन्हें सार्वजनिक तौर पर ऐक्सेस किया जा सकता हो.

अगर क्रॉलर को रीडायरेक्ट का स्टेटस कोड (जैसे, 301 या 302) मिलता है, तो वे रीडायरेक्ट को नए यूआरएल पर फ़ॉलो करते हैं और वहां से आगे बढ़ते हैं. जब उन्हें सही जवाब मिल जाता है, तो इसका मतलब है कि उन्हें उपयोगकर्ताओं के लिए ऐक्सेस किया जा सकने वाला दस्तावेज़ मिल गया है. इसके बाद, वे यह जांच करते हैं कि उसे क्रॉल करने की अनुमति है या नहीं. अनुमति मिलने पर, वे कॉन्टेंट को डाउनलोड कर लेते हैं.

इस जांच में एचटीएमएल और एचटीएमएल में मौजूद सभी कॉन्टेंट शामिल होता है, जैसे कि इमेज, वीडियो या JavaScript. क्रॉलर, एचटीएमएल दस्तावेज़ों से लिंक भी निकालते हैं, ताकि क्रॉलर लिंक किए गए यूआरएल पर भी जा सके. लिंक फ़ॉलो करके, क्रॉलर वेब पर नए पेज ढूंढते हैं.

क्रॉलर, लिंक या बटन पर क्लिक नहीं करते. इसके बजाय, वे यूआरएल को बाद में क्रॉल करने के लिए, सूची में भेजते हैं. किसी नए यूआरएल को ऐक्सेस करते समय, कोई कुकी, सेवा वर्कर या IndexedDB जैसा लोकल स्टोरेज उपलब्ध नहीं होता.

इंडेक्स बनाना

किसी दस्तावेज़ को वापस पाने के बाद, क्रॉलर उस कॉन्टेंट को खोज इंजन को सौंप देता है, ताकि उसे इंडेक्स में जोड़ा जा सके. सर्च इंजन अब कॉन्टेंट को रेंडर करता है और उसका विश्लेषण करता है, ताकि वह उसे समझ सके. रेंडरिंग का मतलब है कि पेज को ब्राउज़र की तरह दिखाना (कुछ सीमाओं के साथ).

सर्च इंजन, कीवर्ड, टाइटल, लिंक, हेडिंग, टेक्स्ट वगैरह पर ध्यान देते हैं. इन्हें सिग्नल कहा जाता है. इनसे पेज के कॉन्टेंट और कॉन्टेक्स्ट के बारे में पता चलता है. सिग्नल की मदद से, सर्च इंजन किसी भी क्वेरी का जवाब सबसे बेहतर पेज के साथ दे पाते हैं.

सर्च इंजन को एक ही कॉन्टेंट अलग-अलग यूआरएल पर मिल सकता है. उदाहरण के लिए, "सेब की पाई" की रेसिपी, /recipes/apple-pie और /recipes/1234 के तहत हो सकती है. खोज इंजन, रेसिपी को दो बार इंडेक्स और दिखाने से रोकने के लिए यह तय करते हैं कि मुख्य यूआरएल क्या होना चाहिए. साथ ही, एक ही कॉन्टेंट दिखाने वाले वैकल्पिक यूआरएल को हटा देते हैं.

सबसे काम के नतीजे दिखाना

सर्च इंजन, इंडेक्स में मौजूद कीवर्ड से क्वेरी को मैच करने के अलावा और भी काम करते हैं. काम के नतीजे देने के लिए, वे संदर्भ, वैकल्पिक शब्द, उपयोगकर्ता की जगह वगैरह का ध्यान रख सकते हैं. उदाहरण के लिए, "सिलिकॉन वैली" से किसी इलाके या टीवी शो का मतलब हो सकता है. हालांकि, अगर क्वेरी "सिलिकॉन वैली कास्ट" है, तो इलाके के हिसाब से मिले नतीजे बहुत काम के नहीं हैं.

कुछ क्वेरी सीधे तौर पर नहीं की जाती हैं. जैसे, "पल्प फ़िक्शन का गाना". ऐसे में, खोज इंजन को इसका मतलब समझना होता है और फ़िल्म के संगीत के नतीजे दिखाने होते हैं. जब कोई उपयोगकर्ता कुछ खोजता है, तो खोज इंजन सबसे काम के नतीजे तय करते हैं और फिर उन्हें उपयोगकर्ता को दिखाते हैं. पेजों को रैंक करने या क्रम से लगाने का फ़ैसला, क्वेरी के आधार पर लिया जाता है. अगर बेहतर जानकारी उपलब्ध होती है, तो समय के साथ क्रम में बदलाव हो सकता है.

अगले चरण: सर्च इंजन के लिए ऑप्टिमाइज़ करने का तरीका

अब जब आपको सर्च इंजन के काम करने के तरीके की बुनियादी जानकारी हो गई है, तो आपको सर्च इंजन के लिए ऑप्टिमाइज़ करने की वैल्यू दिख सकती है. इसे एसईओ या 'सर्च इंजन ऑप्टिमाइज़ेशन' कहते हैं. यह पक्का करके कि सर्च इंजन आपके कॉन्टेंट को ढूंढ और अपने-आप समझ सकते हैं, आप अपनी साइट को काम की खोजों के लिए बेहतर तरीके से दिखा पाते हैं. इससे, आपके कॉन्टेंट में दिलचस्पी रखने वाले ज़्यादा से ज़्यादा लोग आपकी साइट पर आ सकते हैं. Lighthouse की मदद से अपनी साइट का ऑडिट करें और एसईओ के नतीजों की जांच करें. इससे आपको यह पता चलेगा कि सर्च इंजन, उपयोगकर्ताओं को आपके कॉन्टेंट के बारे में कितनी अच्छी तरह बता सकते हैं.