كيفية تحديد الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية"

البحث والمنهجية المستخدَمة في وضع حدود "مؤشرات أداء الويب الأساسية"

تاريخ النشر: 21 أيار (مايو) 2020

مؤشرات أداء الويب الأساسية هي مجموعة من المقاييس الميدانية التي تُقيِّم جوانب مهمة من تجربة المستخدم الفعلية على الويب. تتضمّن "مؤشرات أداء الويب الأساسية" مقاييس، بالإضافة إلى الحدود المستهدفة لكل مقياس، ما يساعد المطوّرين على فهم ما إذا كانت تجربة موقعهم الإلكتروني "جيّدة" أو "بحاجة إلى تحسين" أو "بطيئة". ستوضّح هذه المشاركة المنهج المُستخدَم لتحديد الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية" بشكل عام، بالإضافة إلى كيفية اختيار الحدود الدنيا لكل مقياس محدّد من مقاييس "مؤشرات أداء الويب الأساسية".

تتألف "مؤشرات أداء الويب الأساسية" من ثلاثة مقاييس: سرعة عرض أكبر محتوى مرئي (LCP) ومدى استجابة الصفحة لتفاعلات المستخدم (INP) ومتغيّرات التصميم التراكمية (CLS). يقيس كل مقياس جانبًا مختلفًا من تجربة المستخدم: يقيس مقياس LCP سرعة التحميل التي يلاحظها المستخدم ويحدد النقطة في المخطط الزمني لتحميل الصفحة التي يُحتمل أن يكون فيها المحتوى الرئيسي للصفحة قد اكتمل تحميله. ويقيس مقياس INP الاستجابة ويحدّد كميًا التجربة التي يشعر بها المستخدمون عند محاولة التفاعل مع الصفحة. ويقيس مقياس CLS الثبات البصري ويحدّد كميًا مقدار التغيّر غير المتوقّع في التصميم لمحتوى الصفحة المرئي.

لكل مقياس من مقاييس "مؤشرات أداء الويب الأساسية" حدود مرتبطة به، والتي تحدّد مستوى الأداء على أنّه "جيّد" أو "بحاجة إلى تحسين" أو "بطيء":

اقتراحات الحدود الدنيا لمقياس "سرعة عرض أكبر محتوى مرئي" اقتراحات بشأن مدى استجابة الصفحة لتفاعلات المستخدم اقتراحات بشأن الحدّ الأدنى لمتغيّرات التصميم التراكمية
  جيد سيئ النسبة المئوية
سرعة عرض أكبر جزء من المحتوى على الصفحة ‫2500 ملي ثانية أو أقل أكثر من 4000 ملي ثانية 75
مدى استجابة الصفحة لتفاعلات المستخدم ‫200 ملي ثانية أو أقل أكثر من 500 ملي ثانية 75
متغيّرات التصميم التراكمية ‫≤0.1 أكثر من 0.25 75
حدود مؤشرات أداء الويب الأساسية

بالإضافة إلى ذلك، لتصنيف الأداء العام لصفحة أو موقع إلكتروني، نستخدم قيمة الشريحة المئوية الخامسة والسبعين من جميع مشاهدات الصفحة إلى تلك الصفحة أو الموقع الإلكتروني. بعبارة أخرى، إذا كانت نسبة %75 على الأقل من مشاهدات الصفحة على موقع إلكتروني تستوفي الحدّ الأدنى لمستوى الأداء "الجيد"، يتم تصنيف الموقع الإلكتروني على أنّه يحقّق أداءً "جيدًا" لهذا المقياس. في المقابل، إذا كانت ‫‎25% على الأقل من مشاهدات الصفحة تستوفي الحدّ الأدنى لمستوى الأداء "الضعيف"، يتم تصنيف الموقع الإلكتروني على أنّه يحقّق أداءً "ضعيفًا". على سبيل المثال، إذا كانت قيمة LCP التي تم احتسابها حسب الشريحة المئوية التسعون هي 2 ثانية، يتم تصنيفها على أنّها "جيدة"، بينما إذا كانت قيمة LCP التي تم احتسابها حسب الشريحة المئوية التسعون هي 5 ثواني، يتم تصنيفها على أنّها "سيئة".

معايير الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية"

في هذا القسم، سنلقي نظرة على معايير تقييم الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية". ستقدّم الأقسام اللاحقة مزيدًا من التفاصيل حول كيفية تطبيق هذه المعايير لاختيار الحدود الدنيا لكل مقياس. في السنوات المقبلة، نتوقّع إجراء تحسينات وإضافات على المعايير والحدود الدنيا لتحسين قدرتنا على قياس تجارب المستخدمين الرائعة على الويب.

تجربة مستخدم عالية الجودة

هدفنا الأساسي هو تحسين تجربة المستخدم وتحسين جودة هذه التجربة. ولهذا السبب، نهدف إلى التأكّد من أنّ الصفحات التي تستوفي الحدود الدنيا لقيمة "جيدة" في "مؤشرات أداء الويب الأساسية" تقدّم تجربة مستخدم عالية الجودة.

لتحديد الحدّ الأدنى المرتبط بتجربة المستخدم العالية الجودة، نستند إلى أبحاث الإدراك البشري وتفاعل الإنسان مع الحاسوب. في حين أنّ هذا البحث يتم تلخيصه أحيانًا باستخدام حدّ أدنى ثابت واحد، نجد أنّ البحث الأساسي يتم التعبير عنه عادةً كنطاق من القيم. على سبيل المثال، في ما يتعلّق بالبحث عن مدّة الوقت الذي ينتظره المستخدِمون عادةً قبل فقدان التركيز، يتمّ وصفه أحيانًا بأنّه 1 ثانية، في حين يتمّ التعبير عن البحث الأساسي في الواقع على أنّه نطاق، من مئات المللي ثانية إلى ثوانٍ متعدّدة. تُؤكّد بيانات مقاييس Chrome المجمّعة والمجهولة الهوية حقيقة أنّ حدود قياس الأداء تختلف حسب المستخدم والسياق، ما يشير إلى أنّه ما مِن مدّة واحدة ينتظرها المستخدمون حتى تعرِض صفحة الويب المحتوى قبل إيقاف تحميل الصفحة. بدلاً من ذلك، تعرض هذه البيانات توزيعًا سلسًا ومتواصلًا. لمزيد من المعلومات المتعمّقة حول حدود الإدراك البشري وأبحاث تفاعل الإنسان مع الحاسوب ذات الصلة، يُرجى الاطّلاع على مقالة أسس Web Vitals.

في الحالات التي تتوفّر فيها أبحاث ذات صلة بتجربة المستخدم لمقياس معيّن ويكون هناك إجماع معقول على نطاق القيم الواردة في الأدبيات، نستخدم هذا النطاق كمدخل لتوجيه عملية اختيار الحدّ الأدنى. في الحالات التي يتعذّر فيها إجراء أبحاث ذات صلة بتجربة المستخدم، مثل مقياس جديد مثل "التغيير المتراكم في التنسيق"، نُقيّم بدلاً من ذلك الصفحات في العالم الواقعي التي تستوفي الحدود الدنيا المختلفة للمقياس، لتحديد الحدّ الأدنى الذي يؤدي بدوره إلى تقديم تجربة مستخدم جيدة.

يمكن تحقيقها من خلال محتوى الويب الحالي

بالإضافة إلى ذلك، لضمان نجاح مالكي المواقع الإلكترونية في تحسين مواقعهم لتلبية الحدود الدنيا "الجيدة"، نطلب أن تكون هذه الحدود الدنيا قابلة للتحقيق للمحتوى الحالي على الويب. على سبيل المثال، على الرغم من أنّ قيمة صفر ملي ثانية هي الحدّ المثالي لسرعة عرض أكبر محتوى مرئي (LCP)، ما يؤدي إلى تجارب تحميل فوري، إلا أنّه لا يمكن عمليًا بلوغ الحد الأدنى بالمللي ثانية في معظم الحالات بسبب تأخّر معالجة الشبكة والأجهزة. وبالتالي، إنّ قيمة الصفر بالمللي ثانية ليست معيارًا معقولاً لـ "سرعة عرض أكبر محتوى مرئي" (LCP) في "مؤشرات أداء الويب الأساسية".

عند تقييم الحدود الدنيا "الجيدة" لمؤشرات أداء الويب الأساسية، نتأكّد من أنّه يمكن تحقيق تلك الحدود استنادًا إلى بيانات تقرير تجربة مستخدِمي Chrome (CrUX). للتأكّد من إمكانية تحقيق الحدّ الأدنى، يجب أن تستوفي المصادر نسبة %10 على الأقل من المصادر الحدّ الأدنى "الجيد". بالإضافة إلى ذلك، لضمان عدم تصنيف المواقع الإلكترونية المحسّنة جيدًا بشكل خاطئ بسبب التباين في بيانات تجارب المستخدمِين الحقيقيين، نتحقّق أيضًا من أنّه يتوافق المحتوى المحسّن جيدًا باستمرار مع الحدّ الأدنى لمستوى الأداء "جيد".

في المقابل، نحدّد الحدّ الأدنى لمستوى الأداء "الضعيف" من خلال تحديد مستوى أداء لا يستوفيه سوى أقلية من مصادر البيانات. ما لم يكن هناك بحث متاح بشأن تحديد الحدّ الأدنى لمستوى الأداء "الضعيف"، يتم تلقائيًا تصنيف %10 إلى %30 من مصادر الزيارات ذات الأداء الأسوأ على أنّها "ضعيفة".

ما إذا كان سيتم استخدام المعايير نفسها أو معايير مختلفة لكل جهاز

عادةً ما يكون لاستخدام الأجهزة الجوّالة وأجهزة الكمبيوتر المكتبي خصائص مختلفة جدًا من حيث إمكانات الجهاز وموثوقية الشبكة. يؤثر ذلك بشكل كبير في معايير "قابلية الإنجاز"، لذا نقترح أن نضع حدودًا منفصلة لكل معيار.

ومع ذلك، لا تعتمد توقعات المستخدمين بشأن تجربة جيدة أو سيئة على الجهاز، حتى لو كانت معايير القابلية للتحقيق كذلك. لهذا السبب، لا يتم فصل الحدود الدنيا المقترَحة لمؤشرات أداء الويب الأساسية حسب الجهاز، ويتم استخدام الحدّ الأدنى نفسه لكلا الجهازَين. ويعود ذلك أيضًا بالفائدة على المستخدمين من خلال تسهيل فهم الحدود الدنيا.

بالإضافة إلى ذلك، لا تناسب الأجهزة دائمًا فئة واحدة بشكل جيد. هل يجب أن يستند ذلك إلى شكل الجهاز أو طاقة المعالجة أو أحوال الشبكة؟ ويؤدي استخدام الحدود الدنيا نفسها إلى تجنُّب هذا التعقيد.

تعني الطبيعة الأكثر تقييدًا للأجهزة الجوّالة أنّه يتمّ ضبط معظم الحدود الدنيا استنادًا إلى إمكانية تحقيقها على الأجهزة الجوّالة. ومن المرجّح أن تمثّل هذه الحدود الدنيا متطلبات الأجهزة الجوّالة بدلاً من متطلبات مشتركة حقيقية لجميع أنواع الأجهزة. ومع ذلك، بما أنّ الأجهزة الجوّالة تمثل غالبًا معظم الزيارات إلى معظم المواقع الإلكترونية، لا يشكّل ذلك مصدر قلق كبير.

ملاحظات أخيرة حول المعايير

عند تقييم الحدّ الأدنى لمتطلبات المرشحين، تبيّن لنا أنّ المعايير كانت في بعض الأحيان متعارضة مع بعضها. على سبيل المثال، قد يكون هناك تعارض بين سهولة تحقيق الحدّ الأدنى المطلوب باستمرار وضمان تقديم تجارب جيدة باستمرار للمستخدمين. بالإضافة إلى ذلك، بما أنّ أبحاث الإدراك البشري تقدّم عادةً مجموعة من القيم، وتُظهر مقاييس سلوك المستخدِمين تغييرات تدريجية في السلوك، تبيّن لنا أنّه لا يتوفّر غالبًا حدّ أدنى "صحيح" لمقياس معيّن. وبالتالي، كان منهجنا في "مؤشرات أداء الويب الأساسية" هو اختيار الحدود القصوى التي تستوفي المعايير على أفضل وجه، مع إدراك أنّه ما مِن حدٍّ قصوى مثالي وقد نحتاج أحيانًا إلى الاختيار من بين عدة حدود قصوى معقولة. بدلاً من طرح السؤال "ما هو الحدّ الأدنى المثالي؟"، ركّزنا على طرح السؤال "ما هو الحدّ الأدنى المُقترَح الذي يحقّق معاييرنا على نحوٍ أفضل؟".

اختيار الشريحة المئوية

كما ذكرنا سابقًا، لتصنيف الأداء العام لصفحة أو موقع إلكتروني، نستخدم قيمة الشريحة المئوية الخامسة والسبعين لجميع الزيارات إلى تلك الصفحة أو الموقع الإلكتروني. تم اختيار الشريحة المئوية الـ 75 بناءً على معيارين. أولاً، يجب أن تضمن النسبة المئوية أنّ معظم زيارات الصفحة أو الموقع الإلكتروني حقّقت المستوى المستهدَف من الأداء. ثانيًا، يجب ألا تتأثّر القيمة في الشريحة المئوية المحدّدة بشكل مفرط بقيم الشذوذ.

تتعارض هذه الأهداف مع بعضها البعض إلى حدّ ما. لتحقيق الهدف الأول، عادةً ما تكون النسبة المئوية الأعلى خيارًا أفضل. ومع ذلك، مع الاطّلاع على الارقام المئوية المرتفعة، تزداد أيضًا احتمالية تأثُّر القيمة الناتجة بالقيم الشاذة. إذا كانت بعض زيارات الموقع الإلكتروني تتم من خلال اتصالات شبكة متقطّعة تؤدي إلى الحصول على عيّنات LCP كبيرة جدًا، لا نريد أن يتم تحديد تصنيف الموقع الإلكتروني استنادًا إلى عيّنات القيم الشاذة هذه. على سبيل المثال، إذا كان نقيّم أداء موقع إلكتروني يضمّ 100 زيارة باستخدام قياسٍ مرتفع للنسبة المئوية، مثل النسبة المئوية التسعون، سيتطلّب الأمر 5 عيّنات فقط من القيم الشاذة لكي تتأثّر قيمة قياس النسبة المئوية التسعون بالقيم الشاذة.

بما أن هذه الأهداف متناقضة بعض الشيء، فبعد إجراء التحليل، توصلنا إلى أن الشريحة المئوية الخامسة والسبعين تحقق توازنًا معقولاً. باستخدام الشريحة المئوية التسعون، نعرف أنّ معظم زيارات الموقع الإلكتروني (3 من 4) حقّقت المستوى المستهدَف من الأداء أو أفضل. بالإضافة إلى ذلك، من غير المرجّح أن تتغيّر قيمة الشريحة المئوية الـ 75 بسبب القيم الشاذّة. بالعودة إلى مثالنا، بالنسبة إلى موقع إلكتروني يسجّل 100 زيارة، ستحتاج 25 زيارة من هذه الزيارات إلى الإبلاغ عن عيّنات استثنائية كبيرة للقيمة عند الشريحة المئوية الخامسة والسبعين لتتأثر بالقيم المتطرفة. على الرغم من أنّه من الممكن أن تكون 25 من أصل 100 عيّنة قيمًا شاذة، إلا أنّ ذلك أقلّ احتمالًا بكثير من حالة نسبة ‎95 في المئة.

سرعة عرض أكبر جزء من المحتوى على الصفحة

تم وضع حدود سرعة عرض أكبر محتوى مرئي (LCP) مع مراعاة الاعتبارات التالية المتعلقة بجودة التجربة وقابلية التنفيذ.

جودة التجربة

غالبًا ما يشار إلى ثانية واحدة على أنها مقدار الوقت الذي سينتظره المستخدم قبل أن يبدأ في فقدان التركيز على مهمة ما. عند الفحص الدقيق للبحث ذي الصلة، وجدنا أن الثانية الثانية هي تقريب لوصف مجموعة من القيم، من حوالي عدة مئات من المللي ثانية إلى عدة ثوانٍ.

هناك مصدران شائعان يُشار إليهما بشأن الحدّ الأدنى الذي يبلغ ثانية واحدة، وهما Card and others و Miller. يحدّد "الردّ الفوري" في البطاقة الثانية، استنادًا إلى نظريات Newell الموحدة للتعلّم. يوضّح "نيوول" أنّه يجب تقديم استجابات فورية في غضون ثانية واحدة تقريبًا (أي من 0.3 ثانية تقريبًا إلى 3 ثوانٍ تقريبًا) استجابةً لبعض المحفزات. يستند ذلك إلى مناقشة "قيود الوقت الفعلي على الإدراك" التي أجراها نيويل، والتي أشار فيها إلى أنّ "التفاعلات مع البيئة التي تثير اعتبارات معرفية تتم على مستوى الثواني" التي تتراوح بين 0.5 وثانية أو ثانيتين تقريبًا. لاحظ ميلر، وهو مصدر آخر يُستشهد به عادةً لحد الثانية الواحدة، "أن المهام التي يمكن للبشر أداءها ويقومون بها مع الاتصالات الآلية ستغير شكلها بشكل جدي إذا كانت تأخيرات الاستجابة أكبر من ثانيتين، مع احتمال تمديد لثانية أخرى أو نحو ذلك".

يصف بحث Miller وCard مقدار الوقت الذي سينتظره المستخدم قبل فقدان التركيز على أنّه نطاق، يتراوح بين 0.3 و3 ثوانٍ تقريبًا، ما يشير إلى أنّ الحدّ الأدنى لقيمة LCP "الجيدة" يجب أن يكون ضمن هذا النطاق. بالإضافة إلى ذلك، وبما أنّ الحدّ الأدنى الحالي لـ "سرعة عرض المحتوى على الصفحة الأولى" هو ثانية واحدة، وأنّ "سرعة عرض أكبر محتوى مرئي" يتم عادةً بعد "سرعة عرض أول محتوى على الصفحة" (LCP)، نفرض قيودًا أكثر على نطاق حدود سرعة عرض أكبر محتوى مرئي، من ثانية واحدة إلى 3 ثوانٍ. لتحديد الحدّ الأدنى في هذا النطاق الذي يستوفي معاييرنا على أفضل نحو، ننظر إلى إمكانية تحقيق هذه الحدود الدنيا المُقترَحة بعد ذلك.

القابلية للتحقيق

باستخدام بيانات من CrUX، يمكننا تحديد النسبة المئوية للمصادر على الويب التي تفي بمعايير LCP المرشحة و"الجيدة".

  ثانية واحدة ثانية ونصف ثانيتان ثانيتان ونصف 3 ثوانٍ
phone ‫3.5% 13% 27% 42% 55%
desktop 6.9% 19% 36% 51% 64%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "جيّدة" لحدود LCP المُرشّحة اعتبارًا من نيسان (أبريل) 2020

على الرغم من أنّ أقلّ من% 10 من المصادر تستوفي الحدّ الأدنى المطلوب وهو ثانية واحدة، تستوفي جميع الحدود الأخرى التي تتراوح مدتها من 1.5 إلى 3 ثوانٍ مطلبنا الذي يقضي بأن تستوفي% 10 على الأقل من المصادر الحدّ "جيد"، وبالتالي لا تزال مرشحة صالحة.

بالإضافة إلى ذلك، لضمان إمكانية تحقيق الحدّ الأدنى المحدّد باستمرار في المواقع الإلكترونية التي تم تحسينها بشكل جيد، نحلّل أداء LCP للمواقع الإلكترونية الأفضل أداءً على الويب، لتحديد الحدود الدنيا التي يمكن تحقيقها باستمرار في هذه المواقع الإلكترونية. على وجه التحديد، نهدف إلى تحديد حدّ أدنى يمكن اتّباعه باستمرار في الشريحة المئوية الخامسة والسبعين من المواقع الإلكترونية الأفضل أداءً. تبيّن لنا أنّه لا يمكن تحقيق الحدّ الأدنى الذي يبلغ 1.5 ثانية أو ثانيتَين بشكلٍ متسق، في حين يمكن تحقيق الحدّ الأدنى الذي يبلغ 2.5 ثانية بشكلٍ متسق.

لتحديد الحدّ الأدنى "الضعيف" لمقياس LCP، نستخدم بيانات CrUX لتحديد الحدّ الأدنى الذي يتمّ تخطّيه من قِبل معظم المواقع الإلكترونية:

  3 ثوانٍ 3.5 ثانية 4 ثوانٍ 4.5 ثانية ٥ ثوانٍ
phone 45% 35% 26% 20% 15%
كمبيوتر مكتبي 36% 26% 19% 14% 10%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "سيئة" لحدود LCP المُحتمَلة اعتبارًا من نيسان (أبريل) 2020

إذا كانت المدة 4 ثوانٍ، سيتم تصنيف ما يقرب من% 26 من مصادر الهواتف و% 21 من مصادر أجهزة الكمبيوتر المكتبي على أنّها رديئة. ويندرج ذلك ضمن النطاق المستهدَف الذي يتراوح بين %10 و%30، لذلك نخلص إلى أنّ 4 ثوانٍ هي حدّ مقبول للأداء "الضعيف".

بناءً على ذلك، نستنتج أنّ 2.5 ثانية هي حد معقول "جيد"، و4 ثوانٍ هي الحدّ المعقول "الضعيف" لسرعة عرض أكبر محتوى مرئي.

مدة عرض الاستجابة لتفاعل المستخدم

تمّ تحديد حدود INP استنادًا إلى اعتبارات جودة التجربة وإمكانية تحقيقها التالية.

جودة التجربة

تتسق الأبحاث بشكل معقول في استنتاج أنّ التأخيرات في الملاحظات المرئية التي تصل مدتها إلى 100 ملي ثانية تقريبًا ناتجة عن مصدر مرتبط، مثل البيانات التي يُدخلها المستخدم. يشير هذا إلى أن الحد المثالي للتفاعل مع "الطلاء التالي" سيكون قريبًا من هذا الحد.

في مقالة مُدد الاستجابة: الحدود الثلاثة المُهمّة التي يُشار إليها عادةً من قِبل "جاكوب نيلسن"، يُحدَّد 0.1 ثانية كحدّ أقصى ليشعر المستخدم أنّ النظام يتفاعل على الفور. تقتبس Nielsen من مكتبة "ميلر" و"كارد" التي أشارت إلى كتاب The Perception of Causality الذي كتبه "ميتشوت" عام 1962. في بحث "ميشوت"، تم عرض "عنصرين على الشاشة" للمشاركين في التجربة. يتحرك الجسم "أ" ويتجه نحو الجسم "ب". ويتوقف في اللحظة التي يتلامس فيها مع الجسم "ب"، بينما يبدأ الجسم "ب" بعد ذلك بالتحرك بعيدًا عن الجسم "أ"". يغيّر "ميشوت" الفاصل الزمني بين توقّف الجسم "أ" وبدء حركة الجسم "ب". تبيّن لميشو أنّه في حال تأخّر التأثير لمدة تصل إلى 100 ملي ثانية تقريبًا، يعتقد المشاركون أنّ الجسم "أ" يتسبب في حركة الجسم "ب". بالنسبة إلى التأخيرات التي تتراوح بين 100 ملي ثانية و200 ملي ثانية تقريبًا، يكون الإدراك السببي مختلطًا، وفي حال التأخيرات التي تزيد عن 200 ملي ثانية، يُعتقد أنّ حركة الجسم "ب" لم تعد ناتجة عن الجسم "أ".

وبالمثل، يحدّد ميلر حدًّا أدنى للاستجابة "للاستجابة لبدء التحكّم" على أنّه "إشارة إلى الإجراء الذي يتم عادةً من خلال حركة مفتاح أو مفتاح تبديل أو عضو تحكّم آخر يشير إلى أنّه تم بدء التحكّم فيه بشكلٍ جسدي. يجب أن يُنظر إلى هذا الردّ على أنّه جزء من الإجراء الميكانيكي الذي ينفّذه المشغّل. "التأخير الزمني: لا يزيد عن 0.1 ثانية" ثم يليه "يجب ألا يزيد التأخير بين الضغط على مفتاح وردود الفعل المرئية عن 0.1 إلى 0.2 ثانية".

ومؤخرًا في كتاب Towards the Temporally Perfect Virtual Button، بحث "كاريسوجا" وآخرون عن مفهوم التزامن بين لمس زر افتراضي على شاشة تعمل باللمس والملاحظات المرئية اللاحقة التي تشير إلى أنّ الزر تم لمسه بسبب حالات تأخير مختلفة. عندما كانت التأخير بين الضغط على الزر والملاحظات المرئية 85 مللي ثانية أو أقل، أبلغ المشاركون أن الملاحظات المرئية ظهرت في وقت واحد مع الضغط على الزر 75٪ من الوقت. بالإضافة إلى ذلك، بالنسبة إلى التأخيرات التي تبلغ 100 ملي ثانية أو أقل، أبلغ المشاركون عن جودة ملحوظة للضغط على الزر باستمرار، مع انخفاض الجودة الملاحظَة بسبب التأخيرات من 100 ملي ثانية إلى 150 ملي ثانية، والوصول إلى مستويات منخفضة جدًا للتأخيرات التي تبلغ 300 ملي ثانية.

وبناءً على ذلك، نستنتج أنّ البحث يشير إلى أن 100 ملي ثانية تمثّل مستوى تفاعل "جيد" لسرعة استجابة الصفحة في "مؤشرات أداء الويب". بالإضافة إلى ذلك، ونظرًا لأن المستخدمين أبلغوا عن مستويات جودة منخفضة للتأخيرات التي تبلغ 300 ملي ثانية أو أكثر، من المفترض أن يكون هذا الحد "رديء".

مدى القابلية للتحقيق

باستخدام بيانات من CrUX، تبيّن لنا أنّ معظم مصادر البيانات على الويب تستوفي الحدّ الأدنى "الجيد" لمقياس INP الذي يبلغ 200 ملي ثانية عند الشريحة المئوية الخامسة والسبعون:

  100 ملي ثانية 200 ملي ثانية 300 ملي ثانية 400 ملي ثانية 500 ملي ثانية
phone 12% 56% 76% 88% 92%
desktop 83% 96% 98% 99% 99%
نسبة مصادر CrUX المصنّفة على أنّها "جيدة" لحدود INP المُحتمَلة اعتبارًا من أيار (مايو) 2022

لقد ركزنا أيضًا على إمكانية اجتياز اختبار INP على الأجهزة الجوّالة ذات الأداء المنخفض، حيث تشكّل هذه الأجهزة نسبة عالية من الزيارات إلى المواقع الإلكترونية. أكّد ذلك أيضًا مدى ملاءمة الحدّ الأدنى البالغ 200 ملي ثانية.

مع الأخذ في الاعتبار الحدّ الأدنى البالغ 100 مللي ثانية والمستند إلى الأبحاث حول جودة التجربة ومعايير القابلية للتحقيق، نخلص إلى أنّ 200 مللي ثانية هو حدّ معقول للتجارب الجيدة.

لتحديد الحدّ الأدنى "الضعيف" لمقياس LCP، نستخدم بيانات CrUX لتحديد الحدّ الأدنى الذي تستوفيه معظم مصادر الزيارات:

  100 ملي ثانية 200 ملي ثانية 300 ملي ثانية 400 ملي ثانية 500 ملي ثانية
phone 88% 44% 24% 12% 8%
desktop 17% 4%‎ 2% 1% 1%
نسبة مصادر CrUX المصنّفة على أنّها "سيئة" لحدود INP المُحتمَلة اعتبارًا من أيار (مايو) 2022

يشير ذلك إلى أنّه يمكننا الحصول على حدّ "سيئ" يبلغ 300 ملي ثانية.

ومع ذلك، على عكس LCP وCLS، يرتبط مقياس INP بعلاقة عكسية مع مدى الرواج، فالمواقع الأكثر رواجًا غالبًا ما تكون أكثر تعقيدًا، ما يؤدي إلى زيادة احتمالية ارتفاع مقياس INP. عند الاطّلاع على أهم 10,000 موقع إلكتروني، والتي تشكّل الغالبية العظمى من عمليات التصفّح على الإنترنت، نلاحظ ظهور صورة أكثر تعقيدًا:

  100 ملي ثانية 200 ملي ثانية 300 ملي ثانية 400 ملي ثانية 500 ملي ثانية
phone 97% 77%‎ 55% 37% 24%
desktop 48% 17% 8% 4%‎ 2%
النسبة المئوية لمصادر CrUX في أهم 10,000 موقع إلكتروني مصنّفة على أنّها "بطيئة" لحدود INP المُحتمَلة اعتبارًا من أيار (مايو) 2022

على الأجهزة الجوّالة، سيؤدي الحدّ الأدنى "الرديء" الذي يبلغ 300 ملي ثانية إلى تصنيف معظم المواقع الإلكترونية الرائجة على أنّها "رديئة"، ما يؤدي إلى زيادة معايير إمكانية الإنجاز، في حين أنّ الحدّ الأدنى الذي يبلغ 500 ملي ثانية يناسب بشكل أفضل النطاق الذي يتراوح بين %10 و%30 من المواقع الإلكترونية. تجدر الإشارة أيضًا إلى أنّ الحدّ الأدنى لقيمة "جيد" التي تبلغ 200 ملي ثانية هو أيضًا أكثر صرامة بالنسبة إلى هذه المواقع الإلكترونية، ولكن مع استمرار 23% من المواقع الإلكترونية في اجتياز هذا الحدّ الأدنى على الأجهزة الجوّالة، لا يزال هذا الحدّ الأدنى يلبي معاييرنا التي تبلغ 10%.

لهذا السبب، نعتبر أنّ 200 ملي ثانية هو حدّ "جيد" معقول لمعظم المواقع الإلكترونية، وأنّ أكثر من 500 ملي ثانية هو حدّ "سيئ" معقول.

متغيّرات التصميم التراكمية

تمّ تحديد حدود CLS استنادًا إلى اعتبارات جودة التجربة وإمكانية تحقيقها التالية:

جودة التجربة

متغيّرات التصميم التراكمية (CLS) هو مقياس جديد يقيس مدى تغيّر المحتوى المرئي لصفحة في الصفحة. بما أنّ مقياس متغيّرات التصميم التراكمية (CLS) جديد، لا نعرف أي أبحاث يمكن أن توجّه الحدود الدنيا لهذا المقياس مباشرةً. وبالتالي، لتحديد الحدّ الذي يتوافق مع توقعات المستخدمين، قيّمنا صفحات في العالم الحقيقي بكميات مختلفة من تغيُّر التنسيق، لتحديد الحدّ الأقصى للتغيُّر الذي يُعتبر مقبولًا قبل أن يتسبب في حدوث انقطاعات كبيرة عند استهلاك محتوى الصفحة. في اختباراتنا الداخلية، تبيّن لنا أنّ مستويات التحول التي تبلغ نسبتها 0.15% أو أكثر تُعتبر بشكلٍ متسق مزعجة، في حين أنّ التحول الذي يتراوح نسبته بين 0.1% وأقل يكون ملحوظًا ولكن ليس مزعجًا بشكلٍ مفرط. وبالتالي، على الرغم من أنّ القيمة صفر لتحول التنسيق هي القيمة المثالية، توصّلنا إلى أنّ القيم التي تصل إلى 0.1 هي قيم "جيدة" ليقتصر عليها حدود CLS.

مدى القابلية للتحقيق

استنادًا إلى بيانات CrUX، يمكننا أن نلاحظ أنّ 50% تقريبًا من المصادر تتضمّن قيمة CLS تبلغ 0.05 أو أقل.

  0.05 0.1 0.15
phone 49% 60% ‫69%
كمبيوتر مكتبي 42% 59% ‫69%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "جيدة" لحدود CLS المُحتمَلة اعتبارًا من نيسان (أبريل) 2020

تشير بيانات CrUX إلى أنّ القيمة 0.05 قد تكون حدًّا معقولاً "جيدًا" لمتغيّرات التصميم التراكمية (CLS)، ولكننا ندرك أن هناك بعض حالات الاستخدام التي يصعب فيها تجنّب متغيّرات التصميم المزعجة. على سبيل المثال، بالنسبة إلى المحتوى المضمّن التابع لجهة خارجية، مثل عمليات التضمين على وسائل التواصل الاجتماعي، أحيانًا لا يكون ارتفاع المحتوى المضمّن معروفًا حتى ينتهي من التحميل، وهو ما قد يؤدي إلى تغيير التنسيق أكبر من 0.05. وبالتالي، نخلص إلى أنّه على الرغم من أنّ العديد من مصادر البيانات تستوفي الحدّ الأدنى البالغ 0.05، فإنّ الحدّ الأدنى الأقلّ صرامةً لـ CLS والذي يبلغ 0.1 يحقّق توازنًا أفضل بين جودة التجربة وإمكانية تحقيقها. من الآن فصاعدًا، نأمل أن تحدّد المنظومة المتكاملة للويب حلولاً لمعالجة تغيُّرات التصميم الناتجة عن عمليات التضمين التابعة لجهات خارجية، ما يتيح استخدام قيمة 0.05 أو 0 كحدّ أدنى في متغيّرات التصميم التراكمية (CLS) في المستقبل لمؤشرات Core Web Vitals.

بالإضافة إلى ذلك، لتحديد الحدّ الأدنى "الضعيف" لمقياس CLS، استخدمنا بيانات CrUX لتحديد الحدّ الأدنى الذي تستوفيه معظم مصادر الزيارات:

  0.15 0.2 0.25 0.3
phone 31% 25% 20% 18%
كمبيوتر مكتبي 31% 23% 18% 16%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "سيئة" لحدود متغيّرات التصميم التراكمية (CLS) المُحتمَلة اعتبارًا من نيسان (أبريل) 2020

إذا كان الحد الأدنى 0.25، سيتم تصنيف ما يقرب من% 20 من مصادر الهواتف و18% من مصادر أجهزة الكمبيوتر المكتبي على أنّها "ضعيفة". ويندرج ذلك ضمن النطاق المستهدَف الذي يتراوح بين %10 و%30، لذا توصلنا إلى أنّ 0.25 هو حدّ "سيئ" مقبول.