BILIBILI ने MediaPipe' के डिवाइस पर मौजूद वेब एआई सलूशन का इस्तेमाल करके, वीडियो स्ट्रीम के उपयोगकर्ता अनुभव को बेहतर बनाया. साथ ही, सेशन की अवधि को 30% से ज़्यादा बढ़ाया

Cecilia Cong
Cecilia Cong
Tyler Mullen
Tyler Mullen

बिलिबिली, ग्रेटर चीन के सबसे बेहतरीन मनोरंजन कॉन्टेंट प्लैटफ़ॉर्म में से एक है दक्षिण-पूर्व एशिया में है, जहां यूज़र जनरेटेड कॉन्टेंट का काफ़ी बड़ा डेटाबेस है. ब्रॉडकास्ट और गेमिंग का ऐसा अनुभव मिलता है जो हर महीने 33 करोड़ से ज़्यादा लोगों को आकर्षित करता है सक्रिय उपयोगकर्ता (एमएयू).

BILIBILI के प्लैटफ़ॉर्म की खास सुविधाओं में से एक है: बुलेट स्क्रीन टिप्पणियां, यह जापान और चीन में एक लोकप्रिय सुविधा है, जो वीडियो स्ट्रीम में टेक्स्ट स्क्रोलिंग के रूप में रीयल-टाइम में दर्शक के सुझाव. बुलेट स्क्रीन टिप्पणियों से, लाइव वीडियो कॉन्टेंट में दिलचस्प और इमर्सिव एलिमेंट जुड़ जाता है. दर्शकों से जुड़े रहने के लिए, वे अपने विचार रखते हैं और जवाब देते हैं दूसरे दर्शकों को रीयल टाइम में प्रतिक्रिया दें.

चुनौती

बुलेट स्क्रीन वाली टिप्पणियां, दर्शकों के लिए बातचीत करने का एक दिलचस्प तरीका है इसलिए, यह ज़रूरी है कि स्पीकर की पोर्ट्रेट मोड में उपयोगकर्ताओं को बेहतरीन अनुभव मिले. नीचे दिए गए वीडियो में, बुलेट स्क्रीन पर की गई टिप्पणियों को इससे दर्शकों में रुकावट पैदा होती है और वे लगातार वीडियो देखने से मना कर सकते हैं.

मूल स्थिति: शुरुआती वीडियो में, एक व्यक्ति को बोलते हुए दिखाया जाता है स्पीकर के चेहरे पर, स्क्रीन पर स्क्रोल कर रही टिप्पणियों को.

बुलेट स्क्रीन पर टिप्पणियां करने की सुविधा चालू करने के लिए, स्पीकर के के लिए, आपको एक सटीक मशीन लर्निंग सेगमेंटेशन की ज़रूरत होती है. को डिवाइस पर सही तरीके से चलाना मुश्किल हो. यही वजह है कि ऐतिहासिक तौर पर, इतनी शक्तिशाली सुविधाएं सर्वर साइड पर काम करने वाली होनी चाहिए.

BILIBILI हर दिन कितनी बार कॉन्टेंट दिखाता है, इसे देखते हुए, बड़ी संख्या में इसके कुछ हिस्से बहुत महंगे होंगे. इसलिए, उनकी डेवलपमेंट टीम हमें इस बारे में जानकारी चाहिए थी कि क्या लागत कम करने के लिए क्लाइंट-साइड का समाधान चाहिए. एक और चुनौती क्लाइंट-साइड मशीन लर्निंग का इस्तेमाल करने पर, सीपीयू को मैनेज करना मुश्किल होता है उपयोग को उस सीमा तक बढ़ाया जाता है, जहां प्रदर्शन में रुकावट आती है.

लक्ष्य: आखिर में, BLIBILI चाहता था कि बुलेट स्क्रीन पर टिप्पणियां स्क्रोल की जाएं ऐसा इसलिए किया गया है, ताकि स्पीकर का चेहरा ब्लॉक न हो.

समाधान: उपयोगकर्ता के डिवाइस पर इमेज को अलग-अलग सेगमेंट में बांटना

इन चुनौतियों से निपटने के लिए, BILIBILI के डेवलपर ने MediaPipe और TensorFlow.js की मदद से बॉडी सेगमेंटेशन, यह MediaPipe के इमेज सेगमेंटर के पूर्वज हैं. इससे, डिवाइस पर सेगमेंटेशन एपीआई का बेहतर तरीके से इस्तेमाल करने में मदद मिली. साथ ही, पहले से ट्रेनिंग दी गई सेल्फ़ी और मल्टी-ऑब्जेक्ट सेगमेंटेशन के लिए मॉडल.

BILIBILI अब इस सुविधा को तुरंत दोहरा सकता है और इसका इस्तेमाल कर सकता है. इससे आपको लागत कम करने में मदद मिलेगी और परफ़ॉर्मेंस बनाए रखने में मदद मिलती है.

लागू करना

यहां बताया गया है कि BILIBILI ने इस समाधान को कैसे लागू किया है:

  1. रीयल-टाइम में किरदार की आउटलाइन: BILIBILI ने सेल्फ़ी सेगमेंटर मॉडल का इस्तेमाल किया का इस्तेमाल करें. इससे वे ताकि किरदारों की सीमाओं को साफ़ तौर पर मास्क किया जा सके.
  2. लाइव टिप्पणी की लेयर के साथ इंटिग्रेशन: इसके बाद, उन्होंने एक्सट्रैक्ट किए गए टेक्स्ट को मर्ज कर दिया सीएसएस का इस्तेमाल करके, टिप्पणी की लाइव लेयर पर वर्ण की आउटलाइन mask-image प्रॉपर्टी. मुख्य वर्ण क्षेत्र को पारदर्शी के रूप में सेट करके, बुलेट स्क्रीन पर की गई टिप्पणियां, बिना किसी रुकावट के किरदारों के पीछे दिख सकती हैं रुकावट नहीं डाल सकते.
    आयताकार बॉक्स में नीले रंग का एक वर्ण, दूसरे बॉक्स की ओर इशारा करता है. इस बॉक्स में स्लेटी रंग का वर्ण होता है, जो SVG मास्क को दिखाता है. नीली रेखाओं के साथ प्लस का निशान, लाइव टिप्पणियों की सुविधा दिखाता है. यह वर्ण आउटलाइन के पीछे नीली लाइन के बराबर होती है. इससे कैरेक्टर के पीछे की ओर फ़्लो हो रही टिप्पणियों का पता चलता है.
    इस डायग्राम में दिखाया गया है कि कैसे BILIBILI के डेवलपर ने एक वीडियो एलिमेंट से कैरेक्टर की आउटलाइन निकाली है और MediaPipe के रीयल-टाइम कंप्यूटिंग का इस्तेमाल करके, उसे लाइव टिप्पणी लेयर के साथ इंटिग्रेट किया है.
  3. लागू करने के तरीके को ऑप्टिमाइज़ करें: बिडिंग की रणनीति की जांच करने और यह पक्का करने के लिए ज़रूरी है कि लागू करने से परफ़ॉर्मेंस में गिरावट नहीं आई है.

परफ़ॉर्मेंस का ऑप्टिमाइज़ेशन

बिलिबिली के डेवलपर ने इस्तेमाल किया OffscreenCanvas और वेब वर्कर ज़्यादा समय लेने वाले टास्क को कर्मियों में ले जाएं, ताकि मुख्य थ्रेड के अंदर जाने से बचा जा सके. इसके बाद, उन्होंने मास्क का साइज़ कम कर दिया, क्योंकि सिर्फ़ कैरेक्टर को एक्सट्रैक्ट करने की ज़रूरत होती थी यह इमेज के साइज़ या क्वालिटी पर निर्भर नहीं करता.

मास्क का साइज़ कम करने के बाद, BILIBILI की डेवलपमेंट टीम ने मास्क को फैला दिया और रेंडरिंग को कम करने के लिए, इसे डीओएम लेयर के साथ मर्ज किया हो कमाया जा सकता है.

बॉक्स में एक नीला वर्ण, एक जैसी दिखने वाली इमेज की ओर इशारा करता है. बिंदुओं वाली लाइन, छोटे से काले रंग के बॉक्स की ओर इशारा करती है. इसमें एक पारदर्शी वर्ण दिखता है. काले रंग का छोटा बॉक्स, उसी तरह के बड़े बॉक्स की जानकारी देता है. टिप्पणियों को छोटा करने की यह प्रोसेस और लाइव टिप्पणियों को नीली लाइन से दिखाया जाता है. यह वर्ण के पीछे चल रही टिप्पणियों के मर्ज किए गए नतीजों के बराबर होता है.
इस डायग्राम में दिखाया गया है कि कैसे बिलिबिली ने मास्क के साइज़ को कम करके उसे स्ट्रेच किए गए मास्क के साथ मर्ज किया.

सेशन की अवधि और क्लिक मिलने की दर (सीटीआर) में बढ़ोतरी

वेब की पहुंच और शक्ति को MediaPipe के लचीलेपन के साथ संयोजित करके एआई की मदद से काम करने वाले टूल और BILIBILI ने शानदार और दिलचस्प वेब ऐप्लिकेशन बनाने में कामयाबी हासिल की अनुभव को बेहतर बनाया है. और, लागू करने के सिर्फ़ एक महीने के अंदर, BILIBILI में, सेशन की अवधि में 30% की बढ़ोतरी हुई. साथ ही, 19% की बढ़ोतरी भी हुई लाइव दिखाए जा रहे वीडियो पर क्लिक मिलने की दर (सीटीआर) में.

    30 %

    सेशन की अवधि बढ़ाई गई

    19 साल %

    ज़्यादा क्लिक मिलने की दर (सीटीआर)

MediaPipe के मुफ़्त, डिवाइस पर मौजूद वेब एआई समाधानों की मदद से, BILIBILI के डेवलपर ये वीडियो में दर्शकों की दिलचस्पी बनाए रखने के साथ-साथ, ज़रूरी विज़ुअल एलिमेंट को बेहतर तरीके से बनाए रखने में मदद करते हैं. इससे प्रीमियम वीडियो की परफ़ॉर्मेंस बेहतर होगी. साथ ही, ऐसा स्ट्रीमिंग अनुभव जिसकी उम्मीद दर्शक प्लैटफ़ॉर्म लीडर से करते हैं.

BILIBILI के सीनियर इंजीनियर जून लिउ का एक उद्धरण: MediaPipe के समाधान ने पोर्ट्रेट एक्सट्रैक्शन मॉडल बनाने पर ध्यान दिए बिना, डेवलपमेंट का खर्च बचाने में मदद की.