كيفية تحديد الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية"

البحث والمنهجية المستخدَمة في وضع حدود "مؤشرات أداء الويب الأساسية"

تاريخ النشر: 21 أيار (مايو) 2020

مؤشرات أداء الويب الأساسية هي مجموعة من المقاييس الميدانية التي تُقيِّم جوانب مهمة من تجربة المستخدم الفعلية على الويب. تتضمّن "مؤشرات أداء الويب الأساسية" مقاييس، بالإضافة إلى الحدود المستهدفة لكل مقياس، ما يساعد المطوّرين على فهم ما إذا كانت تجربة موقعهم الإلكتروني "جيّدة" أو "بحاجة إلى تحسين" أو "بطيئة". ستوضّح هذه المشاركة المنهج المُستخدَم لتحديد الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية" بشكل عام، بالإضافة إلى كيفية اختيار الحدود الدنيا لكل مقياس محدّد من مقاييس "مؤشرات أداء الويب الأساسية".

تذكير بالمقاييس والحدود الدنيا لـ "مؤشرات أداء الويب الأساسية"

تتألف "مؤشرات أداء الويب الأساسية" من ثلاثة مقاييس: "سرعة عرض أكبر محتوى مرئي" (LCP) و"مدى استجابة الصفحة لتفاعلات المستخدم" (INP) و"متغيّرات التصميم التراكمية" (CLS). يقيس كل مقياس جانبًا مختلفًا من تجربة المستخدم: يقيس مقياس LCP سرعة التحميل التي يلاحظها المستخدم ويحدد النقطة في المخطط الزمني لتحميل الصفحة التي يُحتمل أن يكون فيها المحتوى الرئيسي للصفحة قد اكتمل تحميله. ويقيس مقياس INP الاستجابة ويحدّد كميًا التجربة التي يشعر بها المستخدمون عند محاولة التفاعل مع الصفحة. ويقيس مقياس CLS الثبات البصري ويحدّد كميًا مقدار التغيّر غير المتوقّع في التصميم لمحتوى الصفحة المرئي.

لكل مقياس من مقاييس "مؤشرات أداء الويب الأساسية" حدود مرتبطة به، والتي تحدّد مستوى الأداء على أنّه "جيّد" أو "بحاجة إلى تحسين" أو "بطيء":

اقتراحات بشأن الحدود الدنيا لمقياس "سرعة عرض أكبر محتوى مرئي" اقتراحات بشأن حدود مقياس "مدى استجابة الصفحة لتفاعلات المستخدم" اقتراحات بشأن الحدّ الأدنى لمتغيّرات التصميم التراكمية
  جيد سيئ النسبة المئوية
سرعة عرض أكبر جزء من المحتوى على الصفحة ‫2500 ملي ثانية أو أقل أكثر من 4000 ملي ثانية 75
مدة عرض الاستجابة لتفاعل المستخدم ‫200 ملي ثانية أو أقل أكثر من 500 ملي ثانية 75
متغيّرات التصميم التراكمية ‫≤0.1 أكثر من 0.25 75
حدود "مؤشرات أداء الويب الأساسية"

بالإضافة إلى ذلك، لتصنيف الأداء العام لصفحة أو موقع إلكتروني، نستخدم قيمة الشريحة المئوية الخامسة والسبعين من جميع مشاهدات الصفحة إلى تلك الصفحة أو الموقع الإلكتروني. بعبارة أخرى، إذا كانت نسبة %75 على الأقل من مشاهدات الصفحة على موقع إلكتروني تستوفي الحدّ الأدنى لمستوى الأداء "الجيد"، يتم تصنيف الموقع الإلكتروني على أنّه يحقّق أداءً "جيدًا" لهذا المقياس. في المقابل، إذا كانت ‫‎25% على الأقل من مشاهدات الصفحة تستوفي الحدّ الأدنى لمستوى الأداء "الضعيف"، يتم تصنيف الموقع الإلكتروني على أنّه يحقّق أداءً "ضعيفًا". على سبيل المثال، إذا كانت قيمة LCP التي تم احتسابها حسب الشريحة المئوية التسعون هي 2 ثانية، يتم تصنيفها على أنّها "جيدة"، بينما إذا كانت قيمة LCP التي تم احتسابها حسب الشريحة المئوية التسعون هي 5 ثواني، يتم تصنيفها على أنّها "سيئة".

معايير حدود مقاييس "مؤشرات أداء الويب الأساسية"

في هذا القسم، سنلقي نظرة على معايير تقييم الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية". ستتناول الأقسام اللاحقة بالتفصيل كيفية تطبيق هذه المعايير لاختيار الحدود الدنيا لكل مقياس. في السنوات المقبلة، نتوقّع إجراء تحسينات وإضافات على المعايير والحدود الدنيا لتحسين قدرتنا على قياس تجارب المستخدمين الرائعة على الويب.

تجربة مستخدم عالية الجودة

هدفنا الأساسي هو تحسين تجربة المستخدم وتحسين جودة هذه التجربة. ولهذا السبب، نهدف إلى التأكّد من أنّ الصفحات التي تستوفي الحدود الدنيا لقيمة "جيدة" في "مؤشرات أداء الويب الأساسية" تقدّم تجربة مستخدم عالية الجودة.

لتحديد الحدّ الأدنى المرتبط بتجربة المستخدم العالية الجودة، نعتمد على أبحاث الإدراك البشري وتفاعل الإنسان مع الحاسوب. في حين أنّ هذا البحث يتم تلخيصه أحيانًا باستخدام حدّ أدنى ثابت واحد، نجد أنّ البحث الأساسي يتم التعبير عنه عادةً كنطاق من القيم. على سبيل المثال، في ما يتعلّق بالبحث عن مدّة الانتظار التي ينتظرها المستخدِمون عادةً قبل فقدان التركيز، يتمّ وصفها أحيانًا بأنّها 1 ثانية، في حين يتمّ التعبير عن البحث الأساسي في الواقع على أنّه نطاق، من مئات المللي ثانية إلى ثوانٍ متعدّدة. تُؤكّد بيانات مقاييس Chrome المجمّعة والمجهولة الهوية حقيقة أنّ حدود قياس الأداء تختلف حسب المستخدم والسياق، ما يشير إلى أنّه ما مِن مدّة زمنية واحدة ينتظرها المستخدمون حتى تعرِض صفحة الويب المحتوى قبل إيقاف تحميل الصفحة. بدلاً من ذلك، تعرض هذه البيانات توزيعًا سلسًا ومتواصلًا. لمزيد من المعلومات المتعمّقة حول حدود الإدراك البشري وأبحاث تفاعل الإنسان مع الحاسوب ذات الصلة، يُرجى الاطّلاع على مقالة أسس Web Vitals.

في الحالات التي تتوفّر فيها أبحاث ذات صلة بتجربة المستخدم لمقياس معيّن ويكون هناك إجماع معقول على نطاق القيم الواردة في الأدبيات، نستخدم هذا النطاق كمدخل لتوجيه عملية اختيار الحدّ الأدنى. في الحالات التي يتعذّر فيها إجراء أبحاث ذات صلة بتجربة المستخدم، مثل مقياس جديد مثل "التغيير المتراكم في التنسيق"، نُقيّم بدلاً من ذلك الصفحات في العالم الواقعي التي تستوفي الحدود الدنيا المختلفة للمقياس، لتحديد الحدّ الأدنى الذي يؤدي بدوره إلى تقديم تجربة مستخدم جيدة.

يمكن تحقيقها من خلال محتوى الويب الحالي

بالإضافة إلى ذلك، لضمان نجاح مالكي المواقع الإلكترونية في تحسين مواقعهم لتلبية الحدود الدنيا "الجيدة"، نطلب أن تكون هذه الحدود الدنيا قابلة للتحقيق للمحتوى الحالي على الويب. على سبيل المثال، على الرغم من أنّ الصفر ملي ثانية هو الحدّ المعياري "الجيد" لسرعة عرض أكبر محتوى مرئي (LCP)، ما يؤدي إلى توفير تجارب تحميل فورية، لا يمكن تحقيق الحدّ المعياري البالغ صفر ملي ثانية عمليًا في معظم الحالات، وذلك بسبب وقت الاستجابة في الشبكة والمعالجة على الجهاز. وبالتالي، فإنّ الصفر ملي ثانية ليس حدًا "جيّدًا" معقولًا لمقياس LCP في "مؤشرات أداء الويب الأساسية".

عند تقييم الحدود الدنيا "الجيدة" لمؤشرات أداء الويب الأساسية، نتأكّد من أنّه يمكن تحقيق تلك الحدود استنادًا إلى البيانات الواردة من تقرير تجربة مستخدِمي Chrome (CrUX). للتأكّد من إمكانية تحقيق الحدّ الأدنى، يجب أن تستوفي المصادر نسبة ‎10% على الأقل من الحدّ الأدنى "الجيد" . بالإضافة إلى ذلك، لضمان عدم تصنيف المواقع الإلكترونية المحسّنة جيدًا بشكل خاطئ بسبب التباين في بيانات تجارب المستخدمِين الحقيقيين، نتحقّق أيضًا من أنّه يتوافق المحتوى المحسّن جيدًا باستمرار مع الحدّ الأدنى لمستوى الأداء "جيد".

في المقابل، نحدّد الحدّ الأدنى لمستوى الأداء "الضعيف" من خلال تحديد مستوى أداء لا يستوفيه سوى أقلية من مصادر البيانات. ما لم يكن هناك بحث متاح بشأن تحديد الحدّ الأدنى لمستوى الأداء "الضعيف"، يتم تلقائيًا تصنيف %10 إلى %30 من مصادر الزيارات ذات الأداء الأسوأ على أنّها "ضعيفة".

ما إذا كان سيتم استخدام المعايير نفسها أو معايير مختلفة لكل جهاز

عادةً ما يكون لاستخدام الأجهزة الجوّالة وأجهزة الكمبيوتر المكتبي خصائص مختلفة جدًا من حيث إمكانات الجهاز وموثوقية الشبكة. يؤثر ذلك بشكل كبير في معايير "قابلية الإنجاز"، لذا نقترح أن نضع حدودًا منفصلة لكل معيار.

ومع ذلك، لا تعتمد توقعات المستخدمين بشأن تجربة جيدة أو سيئة على الجهاز، حتى لو كانت معايير القابلية للتحقيق كذلك. لهذا السبب، لا يتم فصل الحدود الدنيا المقترَحة لمؤشرات أداء الويب الأساسية حسب الجهاز، ويتم استخدام الحدّ الأدنى نفسه لكلا الجهازَين. ويعود ذلك أيضًا بالفائدة على المستخدمين من خلال تسهيل فهم الحدود الدنيا.

بالإضافة إلى ذلك، لا تندرج الأجهزة دائمًا ضمن فئة واحدة. هل يجب أن يستند ذلك إلى شكل الجهاز أو قدرة المعالجة أو شروط الشبكة؟ ومن بين المزايا الجانبية لاستخدام الحدود الدنيا نفسها تجنُّب هذا التعقيد.

ونظرًا لطبيعة الأجهزة الجوّالة الأكثر تقييدًا، يتمّ بالتالي ضبط معظم الحدود الدنيا استنادًا إلى إمكانية تحقيقها على الأجهزة الجوّالة. ومن المرجّح أن تمثّل هذه الحدود الدنيا معايير الأجهزة الجوّالة بدلاً من الحدود الدنيا المشتركة لجميع أنواع الأجهزة. ومع ذلك، بما أنّ الأجهزة الجوّالة تشكل غالبًا نسبة كبيرة من الزيارات إلى معظم المواقع الإلكترونية، لا يشكّل ذلك مصدر قلق كبير.

ملاحظات أخيرة حول المعايير

عند تقييم معايير الأهلية للمرشحين، تبيّن لنا أنّها كانت في بعض الأحيان متعارضة مع بعضها. على سبيل المثال، قد يكون هناك تعارض بين الحدّ الأدنى الذي يمكن تحقيقه باستمرار وضمان توفير تجارب جيدة باستمرار للمستخدمين. بالإضافة إلى ذلك، بما أنّ أبحاث الإدراك البشري تقدّم عادةً مجموعة من القيم، وتُظهر مقاييس سلوك المستخدِمين تغييرات تدريجية في السلوك، تبيّن لنا أنّه لا يتوفّر غالبًا حدّ أدنى "صحيح" لمقياس معيّن. وبالتالي، كان منهجنا في "مؤشرات أداء الويب الأساسية" هو اختيار الحدود القصوى التي تستوفي المعايير على أفضل وجه، مع إدراك أنّه ما مِن حدٍّ قصوى مثالي وقد نحتاج أحيانًا إلى الاختيار من بين عدة حدود قصوى معقولة. بدلاً من طرح السؤال "ما هو الحدّ الأدنى المثالي؟"، ركّزنا على طرح السؤال "ما هو الحدّ الأدنى المُقترَح الذي يحقّق معاييرنا على نحوٍ أفضل؟".

اختيار الشريحة المئوية

كما ذكرنا سابقًا، لتصنيف الأداء العام لصفحة أو موقع إلكتروني، نستخدم قيمة الشريحة المئوية الخامسة والسبعين لجميع الزيارات إلى تلك الصفحة أو الموقع الإلكتروني. تم اختيار المقدار المئوي الذي يمثّل %75 استنادًا إلى معيارَين. أولاً، يجب أن تضمن النسبة المئوية أنّ معظم زيارات الصفحة أو الموقع الإلكتروني حقّقت المستوى المستهدَف من الأداء. ثانيًا، يجب ألا تتأثّر القيمة في الشريحة المئوية المحدّدة بشكل مفرط بقيم الشذوذ.

تتعارض هذه الأهداف مع بعضها البعض إلى حدّ ما. لتحقيق الهدف الأول، عادةً ما يكون المعدّل المئوي الأعلى هو الخيار الأفضل. ومع ذلك، مع الاطّلاع على الارقام المئوية المرتفعة، تزداد أيضًا احتمالية تأثُّر القيمة الناتجة بالقيم الشاذة. إذا كانت بعض زيارات الموقع الإلكتروني تتم من خلال اتصالات شبكة متقطّعة تؤدي إلى الحصول على عيّنات LCP كبيرة جدًا، لا نريد أن يتم تحديد تصنيف الموقع الإلكتروني من خلال عيّنات القيم الشاذة هذه. على سبيل المثال، إذا كان نقيِّم أداء موقع إلكتروني يضمّ 100 زيارة باستخدام قياسٍ مرتفع للنسبة المئوية، مثل النسبة المئوية التسعون، سيتطلّب الأمر 5 عيّنات فقط من القيم الشاذة لكي تتأثّر قيمة قياس النسبة المئوية التسعون بالقيم الشاذة.

وبما أنّ هذه الأهداف متعارضة بعض الشيء، تبيّن لنا بعد التحليل أنّ القيمة المئوية للمركز 75 تحقّق توازنًا معقولاً. باستخدام الشريحة المئوية التسعون، نعرف أنّ معظم زيارات الموقع الإلكتروني (3 من 4) حقّقت المستوى المستهدَف من الأداء أو أفضل. بالإضافة إلى ذلك، من غير المرجّح أن تتغيّر قيمة الشريحة المئوية الـ 75 بسبب القيم الشاذّة. لنعود إلى مثالنا، بالنسبة إلى موقع إلكتروني يتلقّى 100 زيارة، يجب أن تُبلغ 25 زيارة من هذه الزيارات عن عيّنات كبيرة من القيم الشاذة للقيمة في المقدار المئوي الذي يبلغ %75 لكي يتأثر بقيم شاذة. على الرغم من أنّه من الممكن أن تكون 25 من أصل 100 عيّنة قيمًا شاذة، إلا أنّ ذلك أقلّ احتمالًا بكثير من حالة المئة المئوية التسعون.

سرعة عرض أكبر جزء من المحتوى على الصفحة

تمّ تحديد حدود LCP استنادًا إلى اعتبارات جودة التجربة وإمكانية تحقيقها التالية.

جودة التجربة

غالبًا ما يُشار إلى ثانية واحدة على أنّها المدة التي ينتظرها المستخدم قبل أن يبدأ في فقدان التركيز على مهمة معيّنة. بعد التدقيق في الأبحاث ذات الصلة، تبيّن لنا أنّ الثانية هي قيمة تقريبية لوصف مجموعة من القيم، تتراوح تقريبًا بين بضع مئات من المللي ثانية وعدة ثوانٍ.

هناك مصدران شائعان يُشار إليهما بشأن الحدّ الأدنى الذي يبلغ ثانية واحدة، وهما Card and others و Miller. يحدّد "الردّ الفوري" في البطاقة الثانية، استنادًا إلى نظريات Newell الموحدة للتعلّم. يوضّح "نيوول" أنّه يجب تقديم الردّ العميقخلال ثانية واحدة تقريبًا (أي من 0.3 ثانية تقريبًا إلى 3 ثوانٍ تقريبًا)، وذلك لأنّه يجب تقديم ردّ على بعض المحفزات. يستند ذلك إلى مناقشة "قيود الوقت الفعلي على الإدراك" التي أجراها "نيول"، والتي يُشار فيها إلى أنّ "التفاعلات مع البيئة التي تثير اعتبارات معرفية تتم على مستوى الثواني" التي تتراوح بين 0.5 وثانية إلى ثانيتين أو ثلاث ثوانٍ تقريبًا. يشير ميلر، وهو مصدر آخر يُستشهد به عادةً بشأن الحدّ الأدنى الذي يبلغ ثانية واحدة، إلى أنّ "المهام التي يمكن للبشر تنفيذها وسينفّذوها من خلال رسائل المبرمَجة ستغيّر طبيعتها بشكل كبير إذا كانت تأخّرات الاستجابة أكبر من ثانيتَين، مع إمكانية تمديدها ثانية أخرى أو نحو ذلك".

يصف بحث Miller وCard مقدار الوقت الذي سينتظره المستخدم قبل فقدان التركيز على أنّه نطاق، يتراوح بين 0.3 و3 ثوانٍ تقريبًا، ما يشير إلى أنّ الحدّ "الجيد" لمقياس LCP يجب أن يكون ضمن هذا النطاق. بالإضافة إلى ذلك، بما أنّ الحدّ المعياري الحالي لسرعة عرض "المحتوى الأول المرئي" "الجيد" هو ثانية واحدة، وبما أنّ سرعة عرض "أكبر محتوى مرئي" تحدث عادةً بعد سرعة عرض "المحتوى الأول المرئي"، فإنّنا نضيق نطاق الحدود الدنيا المحتملة لمقياس LCP، من ثانية واحدة إلى 3 ثوانٍ. لتحديد الحدّ الأدنى في هذا النطاق الذي يستوفي معاييرنا على أفضل نحو، ننظر إلى إمكانية تحقيق هذه الحدود الدنيا المُقترَحة بعد ذلك.

مدى القابلية للتحقيق

باستخدام بيانات من CrUX، يمكننا تحديد النسبة المئوية لمصادر البيانات على الويب التي تحقّق الحدّ الأدنى لقيمة "جيد" لمقياس LCP.

  ثانية واحدة ثانية ونصف ثانيتان ثانيتان ونصف 3 ثوانٍ
phone ‫3.5% 13% 27% 42% 55%
desktop 6.9% 19% 36% 51% 64%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "جيّدة" لحدود LCP المُرشّحة اعتبارًا من نيسان (أبريل) 2020

على الرغم من أنّ أقل من% 10 من مصادر البيانات تستوفي الحدّ الأدنى البالغ ثانية واحدة، فإنّ جميع الحدود الدنيا الأخرى التي تتراوح بين 1.5 و3 ثوانٍ تستوفي متطلباتنا بأن تستوفي% 10 على الأقل من مصادر البيانات الحدّ الأدنى "الجيد"، وبالتالي تظلّ مصادر بيانات صالحة.

بالإضافة إلى ذلك، لضمان إمكانية تحقيق الحدّ الأدنى المحدّد باستمرار في المواقع الإلكترونية التي تم تحسينها بشكل جيد، نحلّل أداء LCP للمواقع الإلكترونية الأفضل أداءً على الويب، لتحديد الحدود الدنيا التي يمكن تحقيقها باستمرار في هذه المواقع الإلكترونية. على وجه التحديد، نهدف إلى تحديد حدّ أدنى يمكن اتّباعه باستمرار في الشريحة المئوية الخامسة والسبعين من المواقع الإلكترونية الأفضل أداءً. تبيّن لنا أنّه لا يمكن تحقيق الحدّ الأدنى الذي يبلغ 1.5 ثانية أو ثانيتَين بشكلٍ متسق، في حين يمكن تحقيق الحدّ الأدنى الذي يبلغ 2.5 ثانية بشكلٍ متسق.

لتحديد الحدّ الأدنى "الضعيف" لمقياس LCP، نستخدم بيانات CrUX لتحديد الحدّ الأدنى الذي يتمّ تخطّيه من قِبل معظم المواقع الإلكترونية:

  3 ثوانٍ 3.5 ثانية 4 ثوانٍ 4.5 ثانية ٥ ثوانٍ
phone 45% 35% 26% 20% 15%
desktop 36% 26% 19% 14% 10%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "سيئة" لحدود LCP المُحتمَلة اعتبارًا من نيسان (أبريل) 2020

بالنسبة إلى الحدّ الأدنى الذي يبلغ 4 ثوانٍ، سيتم تصنيف ما يقرب من% 26 من مصادر الزيارات من الهواتف و% 21 من مصادر الزيارات من أجهزة الكمبيوتر المكتبي على أنّها سيئة. ويندرج ذلك ضمن النطاق المستهدَف الذي يتراوح بين %10 و%30، لذلك نخلص إلى أنّ 4 ثوانٍ هي حدّ مقبول للأداء "الضعيف".

وبالتالي، نخلص إلى أنّ 2.5 ثانية هي حدّ "جيد" معقول، و4 ثواني هي حدّ "سيئ" معقول لسرعة عرض أكبر محتوى مرئي.

مدة عرض الاستجابة لتفاعل المستخدم

تمّ تحديد حدود INP استنادًا إلى اعتبارات جودة التجربة وإمكانية تحقيقها التالية.

جودة التجربة

تتّسق الأبحاث بشكل معقول في استنتاج أنّ التأخيرات في الملاحظات المرئية التي تصل إلى 100 ملي ثانية تقريبًا يُنظر إليها على أنّها ناتجة عن مصدر مرتبط، مثل إدخال المستخدم. ويشير ذلك إلى أنّ الحدّ الأمثل لقيمة "جيدة" لمقياس "مدة عرض الاستجابة لتفاعل المستخدم" سيكون قريبًا من هذا الحدّ.

في مقالة Jakob Nielsen التي يُشار إليها عادةً بعنوان مُدد الاستجابة: الحدود الثلاثة المُهمّة، يُحدّد 0.1 ثانية كحدّ أقصى ليشعر المستخدم بأنّ النظام يتفاعل بشكل فوري. يشير Nielsen إلى Miller وCard، اللذَين يشيرَان إلى كتاب Michotte الذي صدر عام 1962 بعنوان The Perception of Causality (إدراك السببية). في تجارب ميتشات (Michotte)، يتم عرض "عنصرَين على شاشة " للمشاركين في التجربة. يتحرك الجسم "أ" ويتجه نحو الجسم "ب". ويتوقف في اللحظة التي يتلامس فيها مع الجسم "ب"، بينما يبدأ الجسم "ب" بعد ذلك بالتحرك بعيدًا عن الجسم "أ"". يغيّر "ميشوت" الفاصل الزمني بين توقّف الجسم "أ" وبدء حركة الجسم "ب". تبيّن لميشو أنّه في حال تأخّر التأثير لمدة تصل إلى 100 ملي ثانية تقريبًا، يعتقد المشاركون أنّ الجسم "أ" يتسبب في حركة الجسم "ب". بالنسبة إلى التأخيرات التي تتراوح بين 100 ملي ثانية و200 ملي ثانية تقريبًا، يكون الإدراك السببي مختلطًا، وفي حال التأخيرات التي تزيد عن 200 ملي ثانية، يُعتقد أنّ حركة الجسم "ب" لم تعد ناتجة عن الجسم "أ".

وبالمثل، يحدّد ميلر حدّ الاستجابة "للاستجابة لتفعيل تجهيز التحكّم" على أنّه "إشارة الإجراء المقدَّمة عادةً من خلال حركة مفتاح أو مفتاح تبديل أو عنصر تحكّم آخر يشير إلى أنّه تم تفعيله جسديًا. يجب أن يُنظر إلى هذا الردّ على أنّه جزء من الإجراء الميكانيكي الذي ينفّذه المشغّل. "التأخير الزمني: لا يزيد عن 0.1 ثانية" ثم يليه "يجب ألا يزيد التأخير بين الضغط على مفتاح وردود الفعل المرئية عن 0.1 إلى 0.2 ثانية".

في وقتٍ لاحق، في مقالة Towards the Temporally Perfect Virtual Button (السعي إلى زر افتراضي مثالي من حيث التوقيت)، أجرى "كاريسويا" وآخرون تحقيقًا في الشعور بالالتزامن بين لمس زر افتراضي على شاشة مماسة والملاحظات المرئية اللاحقة التي تشير إلى لمس الزر، لمختلف حالات التأخير. عندما كان التأخير بين الضغط على الزرّ والملاحظات المرئية هو 85 ملي ثانية أو أقل، أفاد المشاركون بأنّ الملاحظات المرئية ظهرت في الوقت نفسه مع الضغط على الزرّ في% 75 من الوقت. بالإضافة إلى ذلك، في حالات التأخير التي تبلغ 100 ملي ثانية أو أقل، أفاد المشاركون بأنّهم لاحظوا جودة عالية باستمرار في ضغط الزر، مع انخفاض الجودة المرئية في حالات التأخير التي تتراوح بين 100 و150 ملي ثانية، ووصولها إلى مستويات منخفضة جدًا في حالات التأخير التي تبلغ 300 ملي ثانية.

استنادًا إلى ذلك، نخلص إلى أنّ الأبحاث تشير إلى أنّ 100 ملي ثانية هو الحدّ "الجيد" لمقياس "مدة عرض الاستجابة لتفاعل المستخدم" في "مؤشرات أداء الويب". بالإضافة إلى ذلك، بما أنّ المستخدِمين أبلغوا عن مستويات جودة منخفضة في حالات التأخير التي تبلغ 300 ملي ثانية أو أكثر، من الأفضل أن يكون هذا هو الحدّ الأدنى لمستوى "الجودة المنخفضة".

مدى القابلية للتحقيق

باستخدام بيانات من CrUX، تبيّن لنا أنّ معظم مصادر البيانات على الويب تستوفي الحدّ الأدنى "الجيد" لمقياس INP الذي يبلغ 200 ملي ثانية عند الشريحة المئوية الخامسة والسبعون:

  100 ملي ثانية 200 ملي ثانية 300 ملي ثانية 400 ملي ثانية 500 ملي ثانية
phone 12% 56% 76% 88% 92%
desktop 83% 96% 98% 99% 99%
نسبة مصادر CrUX المصنّفة على أنّها "جيدة" لحدود INP المُحتمَلة اعتبارًا من أيار (مايو) 2022

لقد ركزنا أيضًا على إمكانية اجتياز اختبار INP على الأجهزة الجوّالة ذات الأداء المنخفض، حيث تشكّل هذه الأجهزة نسبة عالية من الزيارات إلى المواقع الإلكترونية. أكّد ذلك أيضًا مدى ملاءمة الحدّ الأدنى البالغ 200 ملي ثانية.

مع الأخذ في الاعتبار الحدّ الأدنى البالغ 100 مللي ثانية والمستند إلى الأبحاث حول جودة التجربة ومعايير القابلية للتحقيق، نخلص إلى أنّ 200 مللي ثانية هو حدّ معقول للتجارب الجيدة.

لتحديد الحدّ الأدنى "الضعيف" لمقياس LCP، نستخدم بيانات CrUX لتحديد الحدّ الأدنى الذي تستوفيه معظم مصادر الزيارات:

  100 ملي ثانية 200 ملي ثانية 300 ملي ثانية 400 ملي ثانية 500 ملي ثانية
phone 88% 44% 24% 12% 8%
desktop 17% 4%‎ 2% 1% 1%
نسبة مصادر CrUX المصنّفة على أنّها "سيئة" لحدود INP المُحتمَلة اعتبارًا من أيار (مايو) 2022

يشير ذلك إلى أنّه يمكننا ضبط الحدّ الأدنى "الرديء" على 300 ملي ثانية.

ومع ذلك، على عكس LCP وCLS، يرتبط مقياس INP بعلاقة عكسية مع مدى الرواج، فالمواقع الأكثر رواجًا غالبًا ما تكون أكثر تعقيدًا، ما يؤدي إلى زيادة احتمالية ارتفاع مقياس INP. عند الاطّلاع على أهم 10,000 موقع إلكتروني، والتي تشكّل الغالبية العظمى من تصفّح الإنترنت، نلاحظ ظهور صورة أكثر تعقيدًا:

  100 ملي ثانية 200 ملي ثانية 300 ملي ثانية 400 ملي ثانية 500 ملي ثانية
phone 97% 77%‎ 55% 37% 24%
desktop 48% 17% 8% 4%‎ 2%
النسبة المئوية لمصادر CrUX في أهم 10,000 موقع إلكتروني مصنّفة على أنّها "بطيئة" لحدود INP المُحتمَلة اعتبارًا من أيار (مايو) 2022

على الأجهزة الجوّالة، سيؤدي الحدّ الأدنى "الرديء" الذي يبلغ 300 ملي ثانية إلى تصنيف معظم المواقع الإلكترونية الرائجة على أنّها "رديئة"، ما يؤدي إلى تمديد معايير إمكانية الإنجاز، في حين أنّ الحدّ الأدنى الذي يبلغ 500 ملي ثانية يناسب بشكل أفضل النطاق الذي يتراوح بين %10 و%30 من المواقع الإلكترونية. تجدر الإشارة أيضًا إلى أنّ الحدّ الأدنى لقيمة "جيد" التي تبلغ 200 ملي ثانية هو أيضًا أكثر صرامة بالنسبة إلى هذه المواقع الإلكترونية، ولكن مع استمرار 23% من المواقع الإلكترونية في اجتياز هذا الحدّ الأدنى على الأجهزة الجوّالة، لا يزال هذا الحدّ الأدنى يلبي معاييرنا التي تبلغ 10%.

لهذا السبب، نعتبر أنّ 200 ملي ثانية هو حدّ "جيد" معقول لمعظم المواقع الإلكترونية، وأنّ أيّ قيمة تزيد عن 500 ملي ثانية هي حدّ "سيئ" معقول.

متغيّرات التصميم التراكمية

تمّ تحديد حدود CLS استنادًا إلى اعتبارات جودة التجربة وإمكانية تحقيقها التالية:

جودة التجربة

متغيّرات التصميم التراكمية (CLS) هي مقياس جديد يقيس مقدار تغيّر المحتوى المريء في الصفحة. بما أنّ مقياس متغيّرات التصميم التراكمية (CLS) جديد، لا نعرف أي أبحاث يمكنها تحديد الحدود الدنيا لهذا المقياس مباشرةً. وبالتالي، لتحديد الحدّ الذي يتوافق مع توقعات المستخدمين، قيّمنا صفحات في العالم الحقيقي بكميات مختلفة من تغيُّر التنسيق، لتحديد الحد الأقصى للكمية التي يُعتبَر أنّها مقبولة قبل أن تتسبّب في حدوث انقطاعات كبيرة عند استهلاك محتوى الصفحة. في اختباراتنا الداخلية، تبيّن لنا أنّ مستويات التحول التي تبلغ 0.15 أو أعلى كانت تُعتبر بشكلٍ متسق مزعجة، في حين أنّ التحول الذي يبلغ 0.1 أو أقل كان ملحوظًا ولكن ليس مزعجًا بشكلٍ مفرط. وبالتالي، على الرغم من أنّ القيمة صفر لنسبة تغيُّر التنسيق هي مثالية، توصّلنا إلى أنّ القيم التي تصل إلى 0.1 هي حدود "جيدة" ليقيسها قياس CLS.

مدى القابلية للتحقيق

استنادًا إلى بيانات CrUX، يمكننا ملاحظة أنّ ما يقرب من% 50 من مصادر البيانات تحقّق قيمة CLS تبلغ 0.05 أو أقل.

  0.05 0.1 0.15
phone 49% 60% ‫69%
desktop 42% 59% ‫69%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "جيدة" لحدود CLS المُحتمَلة اعتبارًا من نيسان (أبريل) 2020

على الرغم من أنّ بيانات CrUX تشير إلى أنّ 0.05 قد يكون الحدّ المعيّن "الجيد" لقيمة CLS معقولًا، ندرك أنّ هناك بعض حالات الاستخدام التي يكون فيها من الصعب تجنُّب تغييرات التنسيق المزعجة. على سبيل المثال، بالنسبة إلى المحتوى المضمّن التابع لجهات خارجية، مثل المحتوى المضمّن في وسائل التواصل الاجتماعي، لا يكون ارتفاع المحتوى المضمّن معروفًا أحيانًا إلى أن ينتهي تحميله، ما قد يؤدي إلى تحول تنسيق أكبر من 0.05. وبالتالي، نخلص إلى أنّه على الرغم من أنّ العديد من مصادر البيانات تستوفي الحدّ الأدنى 0.05، فإنّ الحدّ الأدنى الأقلّ صرامةً لـ CLS والذي يبلغ 0.1 يحقّق توازنًا أفضل بين جودة التجربة وإمكانية تحقيقها. نأمل أن تحدِّد منظومتنا المتكاملة للويب حلولًا لمعالجة التغيُّرات في التنسيق التي تسبّبها عمليات التضمين التابعة لجهات خارجية، ما سيسمح باستخدام حدّ "جيد" أكثر صرامةً لمقياس CLS‏ (0.05 أو 0) في إصدار مستقبلي من مؤشرات Core Web Vitals.

بالإضافة إلى ذلك، لتحديد الحدّ الأدنى "الضعيف" لمقياس CLS، استخدمنا بيانات CrUX لتحديد الحدّ الأدنى الذي تستوفيه معظم مصادر الزيارات:

  0.15 0.2 0.25 0.3
phone 31% 25% 20% 18%
desktop 31% 23% 18% 16%
النسبة المئوية لمصادر CrUX المصنّفة على أنّها "سيئة" لحدود متغيّرات التصميم التراكمية (CLS) المُحتمَلة اعتبارًا من نيسان (أبريل) 2020

بالنسبة إلى الحدّ الأدنى البالغ 0.25، سيتم تصنيف ما يقرب من% 20 من مصادر الزيارات من الهواتف و% 18 من مصادر الزيارات من أجهزة الكمبيوتر المكتبي على أنّها "سيئة". ويندرج ذلك ضمن النطاق المستهدَف الذي يتراوح بين %10 و%30، لذا توصّلنا إلى أنّ 0.25 هو حدّ مقبول للأداء "الضعيف".