ב-BILIBILI הקיש על פתרון ה-AI באינטרנט של MediaPipe' במכשיר כדי לשפר את חוויית המשתמש בסטרימינג בווידאו ולהגדיל את משך הסשן ב-30%

BILIBILI היא אחת מפלטפורמות התוכן המובילות בתחום הבידור בסין הגדולה ובדרום מזרח אסיה. הפלטפורמה מארחת מסד נתונים עצום של תוכן שנוצר על ידי משתמשים, שידורים חיים וחוויות גיימינג, שמושכים יותר מ-330 מיליון משתמשים פעילים בחודש (MAU).

אחת מהתכונות הייחודיות של פלטפורמת BILIBILI היא השילוב של תגובות מסך עם נקודה, תכונה פופולרית ביפן ובסין שמציגה משוב מהצופים בזמן אמת כטקסט שמוצג בגלילה בסטרימינג של הסרטונים. תגובות בחלונית מאפשרות לכם להוסיף אלמנט מרגש ומעניין לתוכן של סרטונים בשידור חי. התגובות מאפשרות לצופים להביע את המחשבות שלהם ולהגיב לתגובות של צופים אחרים בזמן אמת, וכך לשמור על רמת עניין גבוהה.

האתגר

תגובות בחלונית עם תיבות טקסט הן דרך מעניינת לאפשר לצופים לקיים אינטראקציה עם התוכן, אבל חשוב שהתמונה של הדובר או הדוברת לא תהיה חסומה כדי לספק את חוויית המשתמש הטובה ביותר. בסרטון הבא, תגובות עם תיבות טקסט יכולות להפריע לצופים ולהניא אותם מלצפות בהמשך.

המצב המקורי: בסרטונים הראשונים מוצג אדם שמדבר, והתגובות גולשות במסך מעל הפנים של הדובר.

כדי להציג תגובות בפורמט של נקודות שמופיעות בצורה חלקה מאחורי תמונת הווידאו של הדובר, צריך לבצע פילוח מדויק באמצעות למידת מכונה, ויכול להיות שיהיה קשה להריץ אותו ביעילות במכשיר. לכן, בעבר היה צורך בתמיכה בצד השרת בתכונות חזקות כאלה.

בהתחשב בכמות התוכן ש-BILIBILI מציגה מדי יום, עיבוד חלקים גדולים ממנו בצד השרת יהיה יקר מאוד. לכן, צוות הפיתוח שלהם היה צריך למצוא פתרון בצד הלקוח כדי להפחית את העלות. אתגר נוסף הוא שעם המעבר ללמידת מכונה בצד הלקוח קשה למנוע עלייה בשימוש ב-CPU עד כדי פגיעה בביצועים.

המטרה: בסופו של דבר, ב-BILIBILI רצו שהתגובות במסך הקטן ינועו מימין לשמאל מאחורי הדובר, כדי לא לחסום את הפנים שלו.

הפתרון: פילוח תמונות במכשיר

כדי להתמודד עם האתגרים האלה, המפתחים של BILIBILI השתמשו ב-Body Segmentation with MediaPipe and TensorFlow.js, קודמו של MediaPipe's Image Segmenter. כך קיבלנו ממשק API יעיל לפילוח במכשיר, וגם מודלים שהותאמו מראש לפילוח של סלפי ושל כמה אובייקטים.

עכשיו צוות BILIBILI יכול לתמוך בתכונה במהירות, להוסיף לה פיצ'רים ולשפר אותה, תוך שמירה על הביצועים והפחתת העלויות.

הטמעה

כך BILIBILI הטמיעה את הפתרון הזה:

  1. קווי מתאר של דמויות בזמן אמת: צוות BILIBILI השתמש במודל Selfie Segmenter כדי לחלץ את קווי המתאר של הדמויות לאורך הסרטון. כך הם יכלו ליצור מסכה שסימנה את גבולות התווים.
  2. שילוב עם שכבת התגובות בשידור חי: לאחר מכן, הם מיזגו את קווי המתאר של התווים שחולצו עם שכבת התגובות בשידור חי באמצעות מאפייני CSS‏ mask-image. כשמגדירים את אזור התווים המרכזי כשקוף, התגובות במסך עם התמונות והציטוטים יכולות להופיע בצורה חלקה מאחורי התווים בלי לחסום אותם.
    תו כחול בקופסה מלבנית מצביע על קופסה אחרת עם תו אפור, שמייצג את המסכה של קובץ ה-SVG. סימן חיבור עם קווים כחולים מייצג הוספה של תגובות בשידור חי. יחד, הם יוצרים קווים כחולים מאחורי מתאר של תו, שמייצגים תגובות שמופיעות מאחורי התו.
    תרשים שבו מוצג איך המפתחים של BILIBILI חילוץ קו מתאר של דמות מרכיב וידאו ושילבו אותו בשכבת תגובות בזמן אמת באמצעות מחשוב בזמן אמת של MediaPipe.
  3. ביצוע אופטימיזציה להטמעה: צוות BILIBILI נזקק לבדיקות כדי לוודא שההטמעה לא פגעה בביצועים.

אופטימיזציה של ביצועים

המפתחים של BILIBILI השתמשו ב-OffscreenCanvas וב-Web Workers כדי להעביר משימות שאורכות זמן רב ל-workers, וכך למנוע תפוסה של ה-thread הראשי. לאחר מכן, הם הקטינו את גודל המסכה, כי היא נדרשת רק כדי לחלץ את קווי המתאר של התווים, והיא לא תלויה בגודל או באיכות התמונה.

אחרי שהקטינו את גודל המסכה, צוות הפיתוח של BILIBILI הרחיב את המסכה במהלך הרכבת התמונה ומיזג אותה עם שכבת ה-DOM כדי לצמצם את עומס העיבוד ככל האפשר.

תו כחול בתיבה מצביע על תמונה זהה בגודל מיני. קו מקווקו מצביע על תיבה שחורה קטנה עם תו שקוף. התיבה השחורה הקטנה מפנה לתיבה גדולה זהה. תהליך ההקטנה הזה, יחד עם תגובות בשידור חי שמוצגות באמצעות קווים כחולים, שווה לתוצאות הממוזגות של התגובות שמוצגות מאחורי הדמות.
תרשים שמראה איך צוות BILIBILI צמצם את גודל המסכה ומיזג אותה עם מסכה מורחבת.

עלייה במשך הסשן ובשיעורי הקליקים

בעזרת השילוב של פוטנציאל החשיפה והעוצמה של האינטרנט עם הגמישות של פתרונות ה-AI של MediaPipe, חברת BILIBILI הצליחה לספק חוויית שימוש יעילה ומעניינת באפליקציית אינטרנט למיליוני משתמשים. בנוסף, תוך חודש אחד בלבד מההטמעה, ב-BILIBILI ראו עלייה משמעותית של 30% במשך הסשן ושיפור של 19% בשיעור הקליקים בסרטונים בשידור חי.

    30 %

    עלייה במשך הסשן

    19 %

    שיעור קליקים (CTR) גבוה יותר

בעזרת פתרונות ה-AI ל-Web בחינם של MediaPipe במכשיר, המפתחים של BILIBILI הצליחו לשמור על רכיבים חזותיים חיוניים תוך שמירה על רמת עניין בקרב הצופים, להבטיח ביצועים חלקים ובסופו של דבר לספק חוויית סטרימינג של וידאו ברמה גבוהה שהצופים מצפים ממנה ממנה כפלטפורמה מובילה.

ציטוט מ-Jun Liu, מהנדס בכיר ב-BILIBILI: הפתרון של MediaPipe עזר לנו לחסוך בעלויות הפיתוח בלי להתמקד ביצירת מודל לחילוץ פורטרטים.