שיטות לטעינת אפליקציית אינטרנט במהירות, גם בטלפון פשוט

איך השתמשנו בפיצול קוד, בהטמעת קוד וברינדור בצד השרת ב-PROXX.

Surma

ב-Google I/O 2019, Mariko, ‏ Jake ואני השקנו את PROXX, גרסת אינטרנט מודרנית של משחק מוקשים. אחד מהדברים שמבדילים את PROXX הוא ההתמקדות בנגישות (אפשר לשחק בו באמצעות קורא מסך!) והיכולת לפעול גם בטלפון פשוט וגם במחשב מתקדם. טלפונים רגילים מוגבלים במספר דרכים:

מעבדים (CPU) חלשים
מעבדי GPU חלשים או לא קיימים
מסכים קטנים ללא קלט מגע
כמויות זיכרון מוגבלות מאוד

אבל הם פועלים בדפדפן מודרני והם נוחים מאוד. לכן, יש חזרה של טלפונים עם תכונות בשווקים מתפתחים. רמת המחירים שלהם מאפשרת לקהל חדש לגמרי, שלא היה יכול להרשות לעצמו את זה בעבר, להיכנס לאינטרנט ולהשתמש באינטרנט המודרני. התחזית היא שבשנת 2019 יימכרו כ-400 מיליון טלפונים עם תכונות בסיסיות בהודו בלבד, כך שמשתמשים בטלפונים עם תכונות בסיסיות עשויים להפוך לחלק משמעותי מהקהל שלכם. בנוסף, מהירויות החיבור דומות לאלו של 2G הן הנורמה בשווקים מתפתחים. איך הצלחנו לגרום ל-PROXX לפעול בצורה טובה בתנאים של טלפון נייח?

משחק PROXX.

הביצועים חשובים, והם כוללים גם את ביצועי הטעינה וגם את ביצועי זמן הריצה. הנתונים מראים שביצועים טובים משויכים לשיפור שימור המשתמשים, לשיפור ההמרות, ולחשוב מכל – לשיפור ההכללה. Jeremy Wagner מציג נתונים והבנות נוספים לגבי הסיבות לחשיבות הביצועים.

זה החלק הראשון מתוך סדרה שכוללת שני חלקים. בחלק 1 נסביר על ביצועי הטעינה, ובחלק 2 נסביר על ביצועים בסביבת זמן הריצה.

תיעוד הסטטוס קוו

חשוב מאוד לבדוק את ביצועי הטעינה במכשיר אמיתי. אם אין לכם מכשיר אמיתי, מומלץ להשתמש ב-WebPageTest, ובמיוחד בהגדרה 'הפשוטה'. ב-WPT מתבצעת סדרה של בדיקות טעינה במכשיר אמיתי עם חיבור 3G ממולא.

מהירות 3G היא מהירות טובה למדידה. יכול להיות שאתם רגילים ל-4G, ל-LTE או בקרוב גם ל-5G, אבל המציאות של האינטרנט הנייד נראית שונה לגמרי. אולי אתם ברכבת, בכנס, בקונצרט או בטיסה. סביר להניח שהמהירות שתקבלו שם תהיה קרובה יותר ל-3G, ולפעמים אפילו גרועה יותר.

עם זאת, במאמר הזה נתמקד ב-2G כי קהל היעד של PROXX מוגדר באופן מפורש לטלפונים עם תכונות ולשווקים מתפתחים. אחרי ש-WebPageTest מריץ את הבדיקה, מוצגת רשימת אירועים (waterfall) (בדומה לזו שמוצגת ב-DevTools) וגם פס צילום בחלק העליון. בפס ההקרנה מוצג מה שהמשתמש רואה בזמן שהאפליקציה נטענת. ברשת 2G, חוויית הטעינה של הגרסה ללא אופטימיזציה של PROXX היא די גרועה:

בסרטון הפס-הזמן מוצג מה שהמשתמש רואה כש-PROXX נטען במכשיר אמיתי ברמה נמוכה דרך חיבור 2G ממומש.

כשהמודעה נטענת דרך 3G, המשתמש רואה 4 שניות של רקע לבן. מעל 2G, המשתמש לא רואה כלום במשך יותר מ-8 שניות. אם קראתם את המאמר למה הביצועים חשובים, אתם יודעים שאיבדנו עכשיו חלק גדול מהמשתמשים הפוטנציאליים שלנו בגלל חוסר סבלנות. המשתמש צריך להוריד את כל 62KB של JavaScript כדי שתוכן כלשהו יופיע במסך. הצד החיובי בתרחיש הזה הוא שכל מה שמופיע במסך הוא גם אינטראקטיבי. או שכן?

[הצביעה הראשונה שמשמעותית][FMP] בגרסה ללא אופטימיזציה של PROXX היא _טכנית_ [אינטראקטיבית][TTI], אבל היא לא מועילה למשתמש.

אחרי שהמשתמש מוריד כ-62KB של קוד JS בפורמט gzip ונוצר DOM, הוא יכול לראות את האפליקציה. האפליקציה טכנית אינטראקטיבית. עם זאת, כשבודקים את התוכן הוויזואלי, רואים מציאות אחרת. גופנים של האינטרנט עדיין נטענים ברקע, ועד שהם מוכנים המשתמש לא יכול לראות טקסט. המצב הזה עומד בדרישות של First Meaningful Paint‏ (FMP), אבל הוא בהחלט לא עומד בדרישות של אינטראקטיביות תקינה, כי המשתמש לא יכול לדעת מהו הנושא של אף אחד מהנתונים שהוזנו. לאחר מכן, נדרשת עוד שנייה ב-3G ו-3 שניות ב-2G עד שהאפליקציה מוכנה לשימוש. סה"כ, האפליקציה הופכת לאינטראקטיבית תוך 6 שניות ב-3G ו-11 שניות ב-2G.

ניתוח רשימת רשתות בתהליך בחירת רשת

עכשיו, אחרי שאנחנו יודעים מה המשתמש רואה, אנחנו צריכים להבין למה. לשם כך, אפשר לעיין בתרשים המפל ולנתח למה המשאבים נטענים מאוחר מדי. במעקב שלנו אחרי 2G ב-PROXX, אנחנו רואים שתי נורות אדומות גדולות:

יש כמה קווים דקים בצבעים שונים.
קובצי JavaScript יוצרים שרשרת. לדוגמה, הטעינה של המשאב השני תתחיל רק אחרי שהטעינה של המשאב הראשון תסתיים, והטעינה של המשאב השלישי תתחיל רק אחרי שהטעינה של המשאב השני תסתיים.

תרשים המפל מספק תובנות לגבי המשאבים שנטענים, מתי הם נטענים וכמה זמן נדרש להם.

צמצום מספר החיבורים

כל קו דק (dns, ‏ connect, ‏ ssl) מייצג יצירת חיבור HTTP חדש. הגדרת חיבור חדש היא פעולה יקרה, כי היא נמשכת כ-1 שניות ב-3G וכ-2.5 שניות ב-2G. בתרשים המפלים שלנו מופיע חיבור חדש ל-:

בקשה מס' 1: index.html שלנו
בקשה מס' 5: סגנונות הגופן מ-fonts.googleapis.com
בקשה מס' 8: Google Analytics
בקשה מס' 9: קובץ גופן מ-fonts.gstatic.com
בקשה מס' 14: המניפסט של אפליקציית האינטרנט

החיבור החדש ל-index.html הוא בלתי נמנע. הדפדפן צריך ליצור חיבור לשרת שלנו כדי לקבל את התוכן. אפשר להימנע מהקישור החדש ל-Google Analytics על ידי הטמעה בקוד של שירות כמו Minimal Analytics, אבל Google Analytics לא חוסם את היכולת של האפליקציה שלנו לבצע עיבוד או להפוך לאינטראקטיבית, ולכן לא ממש חשוב לנו כמה מהר היא נטענת. באופן אידיאלי, צריך לטעון את Google Analytics בזמן השהיה, כשכל שאר הרכיבים כבר נטענו. כך הוא לא יתפוס רוחב פס או כוח עיבוד במהלך הטעינה הראשונית. החיבור החדש למניפסט של אפליקציית האינטרנט נקבע על ידי מפרט האחזור, כי המניפסט צריך להיטען בחיבור ללא פרטי כניסה. שוב, קובץ המניפסט של אפליקציית האינטרנט לא חוסם את היכולת של האפליקציה שלנו לבצע עיבוד או להפוך לאינטראקטיבית, כך שלא צריך להדאיג במיוחד.

עם זאת, שני הגופנים והסגנונות שלהם הם בעיה כי הם חוסמים את העיבוד וגם את האינטראקטיביות. אם נבחן את קובץ ה-CSS שמסופק על ידי fonts.googleapis.com, נראה שיש בו רק שני כללי @font-face, אחד לכל גופן. סגנונות הגופן קטנים כל כך, עד שהחלטנו להוסיף אותם לקוד ה-HTML שלנו, וכך להסיר חיבור מיותר אחד. כדי להימנע מהעלות של הגדרת החיבור לקבצי הגופן, אנחנו יכולים להעתיק אותם לשרת שלנו.

ביצוע טעינות במקביל

כשבודקים את תרשים המפל, אפשר לראות שכשהטעינה של קובץ ה-JavaScript הראשון מסתיימת, הטעינה של קבצים חדשים מתחילה מיד. זהו מצב אופייני ליחסי תלות בין מודולים. סביר להניח שבמודול הראשי שלנו יש ייבוא סטטי, ולכן JavaScript לא יכול לפעול עד שהייבוא הזה נטען. חשוב להבין שסוגי יחסי התלות האלה ידועים בזמן ה-build. אנחנו יכולים להשתמש בתגים <link rel="preload"> כדי לוודא שכל יחסי התלות יתחילו להיטען ברגע שנקבל את ה-HTML.

תוצאות

נבחן מה השינויים שלנו השיגו. חשוב לא לשנות משתנים אחרים בהגדרת הבדיקה שעשויים להטות את התוצאות, לכן נשתמש בהגדרה הפשוטה של WebPageTest בשאר הכתבה ונבחן את פס ההמלצות:

אנחנו משתמשים בסרטון של WebPageTest כדי לראות מה השינויים שלנו השיגו.

השינויים האלה צמצמו את זמן ה-TTI מ-11 ל-8.5, כלומר כ-2.5 שניות מזמן הגדרת החיבור שרצינו להסיר. כל הכבוד לנו.

עיבוד מראש

אמנם צמצמנו את TTI, אבל לא השפענו ממש על המסך הלבן הארוך הנצחי שהמשתמשים צריכים לסבול במשך 8.5 שניות. אפשר לטעון שהשיפורים המשמעותיים ביותר ב-FMP מושגים על ידי שליחת רכיבי קוד עם עיצוב ב-index.html. שיטות נפוצות להשגת מטרה זו הן עיבוד מראש ועיצוב בצד השרת. שתי השיטות קשורות זו לזו, והן מפורטות במאמר עיבוד באינטרנט. בשתי השיטות, אפליקציית האינטרנט פועלת ב-Node וה-DOM שנוצר עובר סריאליזציה ל-HTML. רינדור בצד השרת עושה זאת לכל בקשה בצד השרת, ואילו רינדור מראש עושה זאת בזמן ה-build ושומר את הפלט בתור index.html החדש. מכיוון ש-PROXX היא אפליקציית JAMStack ואין לה צד שרת, החלטנו להטמיע עיבוד מראש.

יש הרבה דרכים להטמיע עיבוד מראש. ב-PROXX בחרנו להשתמש ב-Puppeteer, שמפעיל את Chrome ללא ממשק משתמש ומאפשר לשלוט מרחוק במכונה הזו באמצעות Node API. אנחנו משתמשים בזה כדי להחדיר את תגי העיצוב ואת ה-JavaScript שלנו, ואז לקרוא מחדש את ה-DOM כמחרוזת של HTML. מכיוון שאנחנו משתמשים במודולים של CSS, אנחנו מקבלים הטמעת CSS של הסגנונות שאנחנו צריכים בחינם.

  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.setContent(rawIndexHTML);
  await page.evaluate(codeToRun);
  const renderedHTML = await page.content();
  browser.close();
  await writeFile("index.html", renderedHTML);

לאחר ביצוע הפעולות האלה, נוכל לצפות לשיפור ב-FMP שלנו. עדיין עלינו לטעון ולהריץ את אותו נפח של JavaScript כמו בעבר, ולכן לא צפוי שינוי משמעותי ב-TTI. אם משהו השתנה, index.html שלנו גדל ויכול להיות שהוא יאריך קצת את זמן ה-TTI. יש רק דרך אחת לבדוק זאת: הפעלת WebPageTest.

בסרטון מוצג שיפור ברור במדד FMP שלנו. זמן הטעינה הראשוני (TTI) לא מושפע ברוב המקרים.

זמן ה-First Meaningful Paint ירד מ-8.5 שניות ל-4.9 שניות, שיפור משמעותי. זמן הטעינה הראשוני עדיין מתרחש תוך כ-8.5 שניות, כך שהשינוי הזה לא השפיע עליו במידה רבה. מה שעשינו כאן הוא שינוי חושי. יש כאלה שיגדירו את זה כתרמית. אנחנו משנים את חוויית הטעינה של המשחק על ידי עיבוד גרפי ביניים של המשחק.

הטמעה בקוד

מדד נוסף שמוצג גם ב-DevTools וגם ב-WebPageTest הוא זמן אחזור ראשון (TTFB). זהו הזמן שחלף מהבייט הראשון של הבקשה שנשלחה ועד לבייט הראשון של התגובה שהתקבלה. הזמן הזה נקרא גם זמן נסיעה הלוך ושוב (RTT), אם כי מבחינה טכנית יש הבדל בין שני המספרים האלה: זמן הנסיעה הלוך ושוב לא כולל את זמן העיבוד של הבקשה בצד השרת. ב-DevTools וב-WebPageTest, זמן אחזור ה-TTFB מוצג בצבע בהיר בתוך הבלוק של הבקשה/התגובה.

החלק הבהיר של הבקשה מציין שהבקשה ממתינה לקבלת הבייט הראשון של התגובה.

כשבודקים את רשימת הבקשות, אפשר לראות שכל הבקשות מבזבזות את רוב הזמן שלהן בהמתנה לקבלת הבייט הראשון בתגובה.

הבעיה הזו היא הסיבה המקורית ליצירת HTTP/2 Push. מפתח האפליקציה יודע שיש צורך במשאבים מסוימים ויכול להעביר אותם. עד שהלקוח מבין שהוא צריך לאחזר משאבים נוספים, הם כבר נמצאים במטמון הדפדפן. התברר שקשה מאוד להשתמש ב-HTTP/2 Push בצורה נכונה, ולכן לא מומלץ להשתמש בו. נבחן מחדש את הבעיה הזו במהלך התקנת התקן של HTTP/3. בינתיים, הפתרון הפשוט ביותר הוא להטמיע את כל המשאבים הקריטיים על חשבון היעילות של האחסון במטמון.

הקוד הקריטי של ה-CSS כבר מוטמע בקוד של הדף, הודות למודולים של CSS ולכלי ה-pre-renderer שלנו שמבוסס על Puppeteer. ב-JavaScript, צריך להטמיע בקוד את המודולים הקריטיים ואת יחסי התלות שלהם. רמת הקושי של המשימה הזו משתנה בהתאם ל-bundler שבו אתם משתמשים.

הוספת הקוד של JavaScript לקוד המקור צמצמה את זמן הטעינה הראשוני מ-8.5 שניות ל-7.2 שניות.

כך הצלחנו לקצר את זמן הטעינה הראשוני ב-1 שנייה. הגענו לנקודה שבה index.html מכיל את כל מה שדרוש לעיבוד הראשוני ולהפיכת התמונה לאינטראקטיבית. ה-HTML יכול לעבור עיבוד בזמן ההורדה, וכך נוצר קובץ ה-FMP. ברגע שה-HTML מסתיים בניתוח ובביצוע, האפליקציה הופכת לאינטראקטיבית.

פיצול קוד אגרסיבי

כן, index.html מכיל את כל מה שדרוש כדי להפוך לאינטראקטיבי. אבל בבדיקה מעמיקה יותר מתברר שהוא מכיל גם את כל שאר הדברים. קובץ ה-index.html שלנו הוא בגודל של כ-43KB. ננסה להבין את הנושא בהקשר של מה שהמשתמש יכול לבצע איתו אינטראקציה בהתחלה: יש לנו טופס להגדרת המשחק שמכיל כמה רכיבים, לחצן התחלה וכנראה קוד כלשהו לשמירה ולטעינה של הגדרות המשתמש. זה בערך הכול. 43KB נראה כמו הרבה.

דף הנחיתה של PROXX. כאן נעשה שימוש רק ברכיבים קריטיים.

כדי להבין מאיפה מגיע גודל החבילה, אפשר להשתמש בכלי לניתוח מפות מקור או בכלי דומה כדי לפרק את החבילה ולבדוק ממה היא מורכבת. כצפוי, החבילה שלנו מכילה את הלוגיקה של המשחק, מנוע הרינדור, מסך הניצחון, מסך ההפסד ועוד כמה כלי עזר. רק קבוצת משנה קטנה של המודולים האלה נדרשת לדף הנחיתה. העברת כל מה שלא נדרש באופן מוחלט לאינטראקטיביות למודול שנטען באיטיות תפחית את זמן הטעינה הראשוני באופן משמעותי.

ניתוח התוכן של הקובץ index.html של PROXX מראה הרבה משאבים מיותרים. משאבים קריטיים מודגשים.

מה שצריך לעשות הוא פיצול קוד. כשמחלקים את הקוד, החבילה המונוליטית מחולקת לחלקים קטנים יותר שאפשר לטעון לפי דרישה (lazy-load). חבילות פופולריות כמו Webpack,‏ Rollup ו-Parcel תומכות בפיצול קוד באמצעות import() דינמי. ה-bundler ינתח את הקוד וידביק את כל המודולים שיובאו סטטית. כל מה שמייבאים באופן דינמי יועבר לקובץ משלו, והוא יוחזר מהרשת רק אחרי ביצוע הקריאה import(). כמובן, לשימוש ברשת יש עלות, וצריך לעשות זאת רק אם יש לכם זמן פנוי. העיקרון הוא לייבא באופן סטטי את המודולים שחיוניים בזמן הטעינה, ולטעון באופן דינמי את כל השאר. עם זאת, לא כדאי לחכות לרגע האחרון כדי לטעון באיטרציה מודולים שבהם בהחלט ייעשה שימוש. Idle Until Urgent של Phil Walton הוא דפוס מצוין לאיזון בין טעינת נתונים בזמן השהיה לטעינת נתונים מיידית.

ב-PROXX יצרנו קובץ lazy.js שמייבא באופן סטטי את כל מה שלא נדרש לנו. לאחר מכן, נוכל לייבא את lazy.js באופן דינמי בקובץ הראשי. עם זאת, חלק מהרכיבים שלנו ב-Preact הגיעו ל-lazy.js, וזה התברר כקצת מסובך כי Preact לא יכול לטפל ברכיבים שנטענים באיטיות מחוץ לקופסה. לכן כתבנו מעטפת רכיב deferred שמאפשרת לנו להציג placeholder עד שהרכיב בפועל נטען.

export default function deferred(componentPromise) {
  return class Deferred extends Component {
    constructor(props) {
      super(props);
      this.state = {
        LoadedComponent: undefined
      };
      componentPromise.then(component => {
        this.setState({ LoadedComponent: component });
      });
    }

    render({ loaded, loading }, { LoadedComponent }) {
      if (LoadedComponent) {
        return loaded(LoadedComponent);
      }
      return loading();
    }
  };
}

עכשיו אפשר להשתמש ב-Promise של רכיב בפונקציות render(). לדוגמה, הרכיב <Nebula>, שמרינדר את קובץ האימג' המונפש של הרקע, יוחלף ב-<div> ריק בזמן הטעינה של הרכיב. אחרי שהרכיב נטען ומוכן לשימוש, ה-<div> יוחלף ברכיב בפועל.

const NebulaDeferred = deferred(
  import("/components/nebula").then(m => m.default)
);

return (
  // ...
  <NebulaDeferred
    loading={() => <div />}
    loaded={Nebula => <Nebula />}
  />
);

בעזרת כל השינויים האלה, הצלחנו לצמצם את index.html ל-20KB בלבד, פחות ממחצית מהגודל המקורי. מה ההשפעה של השינוי הזה על FMP ו-TTI? כלי WebPageTest יגיד לכם!

רצועת התמונות מאשרת: זמן הטעינה הראשוני שלנו עכשיו הוא 5.4 שניות. שיפור משמעותי מה-11s המקורית שלנו.

ההפרש בין FMP ל-TTI הוא רק 100 אלפיות השנייה, כי מדובר רק בניתוח ובביצוע של JavaScript מוטמע. אחרי 5.4 שניות בלבד ב-2G, האפליקציה הופכת לאינטראקטיבית לחלוטין. כל שאר המודולים הפחות חיוניים נטענים ברקע.

עוד טריקים

אם תעיינו ברשימת המודולים הקריטיים שלמעלה, תראו שמנוע הרינדור לא נכלל במודולים הקריטיים. כמובן, המשחק לא יכול להתחיל עד שנקבל מנוע עיבוד גרפי שיעבד את המשחק. אנחנו יכולים להשבית את הלחצן 'התחלה' עד שמנוע הרינדור שלנו יהיה מוכן להפעיל את המשחק, אבל מניסיון שלנו, בדרך כלל המשתמש לוקח מספיק זמן להגדיר את הגדרות המשחק, כך שזה לא הכרחי. ברוב המקרים, מנוע הרינדור והמודולים האחרים יסתיימו לטעינת הנתונים עד שהמשתמש ילחץ על 'התחלה'. במקרים נדירים שבהם המשתמש מהיר יותר מהחיבור שלו לרשת, מוצג מסך טעינה פשוט שממתין לסיום המודולים הנותרים.

סיכום

חשוב למדוד. כדי לא לבזבז זמן על בעיות לא אמיתיות, מומלץ תמיד למדוד לפני שמטמיעים אופטימיזציות. בנוסף, יש לבצע את המדידות במכשירים אמיתיים עם חיבור 3G, או ב-WebPageTest אם אין מכשיר אמיתי זמין.

פס ההמלצות יכול לספק תובנות לגבי התחושה של המשתמש בזמן טעינת האפליקציה. בעזרת מפל המשימות תוכלו לדעת אילו משאבים אחראים לזמני טעינה ארוכים. ריכזנו כאן רשימת משימות שתוכלו לבצע כדי לשפר את ביצועי הטעינה:

שולחים כמה שיותר נכסים דרך חיבור אחד.
טעינה מראש או אפילו משאבים מוטמעים שנדרשים לעיבוד הגרפי הראשון וליכולת האינטראקציה.
עיבוד מראש של האפליקציה כדי לשפר את ביצועי הטעינה שנראים למשתמש.
כדאי להשתמש בפיצול קוד אגרסיבי כדי לצמצם את כמות הקוד שנדרשת לאינטראקטיביות.

כדאי להישאר מעודכנים לגבי חלק 2, שבו נדון באופטימיזציה של ביצועי זמן הריצה במכשירים עם מגבלות חמורות.