सर्च इंजन क्या करता है?
सर्च इंजन, लाइब्रेरियन का डिजिटल वर्शन हैं. ये किसी क्वेरी के लिए सही जानकारी ढूंढने में मदद करने के लिए, एक बड़े इंडेक्स का इस्तेमाल करते हैं. खोज के बुनियादी सिद्धांतों को समझने से, उपयोगकर्ताओं को अपना कॉन्टेंट ढूंढने में मदद मिलती है.
क्रॉलर, वेब को कैसे ब्राउज़ करते हैं
क्रॉल करना, लाइब्रेरी में मौजूद सभी किताबें पढ़ने जैसा है. सर्च इंजन, खोज के नतीजे दिखाने से पहले, वेब से ज़्यादा से ज़्यादा जानकारी इकट्ठा करते हैं. ऐसा करने के लिए, सर्च इंजन किसी क्रॉलर का इस्तेमाल करते हैं. यह एक ऐसा प्रोग्राम है जो साइट से साइट पर जाता है और ब्राउज़र की तरह काम करता है.
अगर कोई किताब या दस्तावेज़ मौजूद नहीं है या खराब हो गया है, तो क्रॉलर उसे नहीं पढ़ सकता. क्रॉलर, दस्तावेज़ की स्थिति का पता लगाने के लिए हर यूआरएल को फ़ेच करने की कोशिश करते हैं. अगर कोई दस्तावेज़ गड़बड़ी का स्टेटस कोड दिखाता है, तो क्रॉलर उसके किसी भी कॉन्टेंट का इस्तेमाल नहीं कर सकते. हालांकि, वे बाद में यूआरएल को फिर से क्रॉल करने की कोशिश कर सकते हैं. इससे यह पक्का होता है कि सिर्फ़ सार्वजनिक तौर पर ऐक्सेस किए जा सकने वाले दस्तावेज़ इंडेक्स में शामिल किए जाएं.
अगर क्रॉलर को रीडायरेक्ट का स्टेटस कोड (जैसे कि 301 या 302) मिलता है, तो वे रीडायरेक्ट को नए यूआरएल पर फ़ॉलो करते हैं और वहां से आगे बढ़ते हैं. जब उन्हें सही जवाब मिल जाता है, तो इसका मतलब है कि उन्हें उपयोगकर्ताओं के लिए ऐक्सेस किया जा सकने वाला दस्तावेज़ मिल गया है. इसके बाद, वे यह जांच करते हैं कि उसे क्रॉल करने की अनुमति है या नहीं. अनुमति मिलने पर, वे कॉन्टेंट को डाउनलोड कर लेते हैं.
इस जांच में एचटीएमएल और एचटीएमएल में मौजूद सभी कॉन्टेंट शामिल होता है, जैसे कि इमेज, वीडियो या JavaScript. क्रॉलर, एचटीएमएल दस्तावेज़ों से लिंक भी निकालते हैं, ताकि क्रॉलर लिंक किए गए यूआरएल पर भी जा सके. लिंक फ़ॉलो करके, क्रॉलर वेब पर नए पेज ढूंढते हैं.
क्रॉलर, लिंक या बटन पर क्लिक नहीं करते. इसके बजाय, वे यूआरएल को बाद में क्रॉल करने के लिए, सूची में भेजते हैं. किसी नए यूआरएल को ऐक्सेस करते समय, कोई कुकी, सेवा वर्कर या IndexedDB जैसा लोकल स्टोरेज उपलब्ध नहीं होता.
इंडेक्स बनाना
किसी दस्तावेज़ को वापस पाने के बाद, क्रॉलर उस कॉन्टेंट को खोज इंजन को सौंप देता है, ताकि उसे इंडेक्स में जोड़ा जा सके. सर्च इंजन अब कॉन्टेंट को रेंडर करता है और उसका विश्लेषण करता है, ताकि वह उसे समझ सके. रेंडरिंग का मतलब है कि पेज को ब्राउज़र की तरह दिखाना (कुछ सीमाओं के साथ).
सर्च इंजन, कीवर्ड, टाइटल, लिंक, हेडिंग, टेक्स्ट वगैरह पर ध्यान देते हैं. इन्हें सिग्नल कहा जाता है. इनसे पेज के कॉन्टेंट और कॉन्टेक्स्ट के बारे में पता चलता है. सिग्नल की मदद से, सर्च इंजन किसी भी क्वेरी का जवाब सबसे बेहतर पेज के साथ दे पाते हैं.
सर्च इंजन को एक ही कॉन्टेंट अलग-अलग यूआरएल पर मिल सकता है. उदाहरण के लिए, "सेब की पाई" की रेसिपी, /recipes/apple-pie
और /recipes/1234
के तहत हो सकती है. खोज के नतीजों में एक ही रेसिपी को दो बार न दिखाने और इंडेक्स न करने के लिए, खोज इंजन यह तय करते हैं कि मुख्य यूआरएल क्या होना चाहिए. साथ ही, एक ही कॉन्टेंट दिखाने वाले वैकल्पिक यूआरएल को हटा देते हैं.
सबसे काम के नतीजे दिखाना
सर्च इंजन, इंडेक्स में मौजूद कीवर्ड से क्वेरी को मैच करने के अलावा और भी काम करते हैं. काम के नतीजे देने के लिए, वे संदर्भ, वैकल्पिक शब्द, उपयोगकर्ता की जगह वगैरह का ध्यान रख सकते हैं. उदाहरण के लिए, "सिलिकॉन वैली" से किसी इलाके या टीवी शो का मतलब हो सकता है. हालांकि, अगर क्वेरी "सिलिकॉन वैली कास्ट" है, तो इलाके के हिसाब से नतीजे बहुत मददगार नहीं होते.
कुछ क्वेरी सीधे तौर पर नहीं की जाती हैं. जैसे, "पल्प फ़िक्शन का गाना". ऐसे में, खोज इंजन को इसका मतलब समझना होता है और फ़िल्म के संगीत के नतीजे दिखाने होते हैं. जब कोई उपयोगकर्ता कुछ खोजता है, तो खोज इंजन सबसे काम के नतीजे तय करते हैं और फिर उन्हें उपयोगकर्ता को दिखाते हैं. पेजों को रैंक करने या क्रम से लगाने का फ़ैसला, क्वेरी के आधार पर लिया जाता है. अगर बेहतर जानकारी उपलब्ध होती है, तो समय के साथ क्रम में बदलाव हो सकता है.
अगले चरण: सर्च इंजन के लिए ऑप्टिमाइज़ करने का तरीका
अब जब आपको सर्च इंजन के काम करने के तरीके की बुनियादी जानकारी है, तो आपको सर्च इंजन के लिए ऑप्टिमाइज़ करने की अहमियत दिख सकती है. इसे एसईओ या 'सर्च इंजन ऑप्टिमाइज़ेशन' कहते हैं. यह पक्का करके कि सर्च इंजन आपके कॉन्टेंट को ढूंढ और अपने-आप समझ सकते हैं, आप अपनी साइट को काम की खोजों के लिए बेहतर तरीके से दिखा पाते हैं. इससे, आपकी साइट पर दिलचस्पी रखने वाले ज़्यादा से ज़्यादा लोग आ सकते हैं. Lighthouse की मदद से अपनी साइट का ऑडिट करें और एसईओ के नतीजों की जांच करें. इससे आपको यह पता चलेगा कि सर्च इंजन, उपयोगकर्ताओं को आपके कॉन्टेंट के बारे में कितनी अच्छी तरह बता सकते हैं.