تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

تحديد حدود مقاييس "مؤشرات أداء الويب الأساسية"

الأبحاث والمنهجية المتّبعة في معايير "مؤشرات أداء الويب الأساسية"

Bryan McQuade

مؤشرات أداء الويب الأساسية هي مجموعة من مقاييس الحقول التي تقيس الجوانب المهمة لتجربة المستخدم الفعلية على الويب. تشمل مؤشرات الأداء الأساسية للويب مقاييس بالإضافة إلى حدود مستهدَفة لكل مقياس، ما يساعد المطوّرين على فهم ما إذا كانت تجربة مواقعهم الإلكترونية "جيدة" أو "بحاجة إلى تحسين" أو "سيئة". تشرح هذه المشاركة الطريقة المتَّبعة لاختيار الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية" بشكل عام، بالإضافة إلى كيفية اختيار الحدود لكل مقياس محدّد من هذه المقاييس.

تنشيط الذاكرة: مقاييس "مؤشرات أداء الويب الأساسية" وحدودها

في العام 2020، تتضمّن "مؤشرات أداء الويب الأساسية" ثلاثة مقاييس: سرعة عرض أكبر محتوى مرئي (LCP) ومهلة الاستجابة الأولى (FID) ومتغيّرات التصميم التراكمية (CLS). يقيس كل مقياس جانبًا مختلفًا من تجربة المستخدم: يقيس LCP سرعة التحميل الملحّة ويحدِّد النقطة في المخطط الزمني لتحميل الصفحة عند احتمال تحميل المحتوى الرئيسي للصفحة. ويقيس مقياس FID مدى استجابة المستخدمين ويحدّد كم التجربة التي يشعر بها المستخدمون عند محاولة التفاعل لأول مرة مع الصفحة. أمّا CLS، فهو يقيس الثبات البصري ويحدّد مقدار تغيُّر التصميم غير المتوقّع لمحتوى الصفحة المرئي.

لكل مقياس في "مؤشرات أداء الويب الأساسية" حدود مرتبطة بها تصنّف الأداء على أنّه "جيد" أو "بحاجة إلى تحسين" أو "ضعيف":

اقتراحات الحدّ الأدنى لسرعة عرض أكبر محتوى مرئي

اقتراحات الحد الأدنى لمهلة الاستجابة الأولى

اقتراحات الحدّ الأدنى لمتغيّرات التصميم التراكمية

	جيد	سيئ	النسبة المئوية
سرعة عرض أكبر جزء من المحتوى على الصفحة	≤ 2500 ملي ثانية	أكثر من 4,000 ملي ثانية	75
مهلة الاستجابة الأولى	≤ 100 ملي ثانية	أكثر من 300 ملّي ثانية	75
متغيّرات التصميم التراكمية	0.1 أو أقل	أكثر من 0.25	75

بالإضافة إلى ذلك، نستخدم القيمة المئوية الخامسة والسبعين لجميع مشاهدات الصفحة على الويب أو الموقع الإلكتروني لتصنيف الأداء العام لصفحة أو موقع إلكتروني. بعبارة أخرى، إذا كانت مشاهدات الصفحة على الويب في ما لا يقل عن 75 بالمئة من مشاهدات الصفحة على الويب تستوفي الحدّ الأدنى "جيد"، يتم تصنيف الموقع على أنّه يحقّق أداء "جيد" لهذا المقياس. أما إذا تحققت نسبة 25 في المئة من مشاهدات الصفحة على الأقل الحد الأدنى "ضعيفًا"، فسيتم تصنيف الموقع على أنه ذو أداء "ضعيف". على سبيل المثال، يتمّ تصنيف سرعة عرض أكبر جزء من المحتوى على الصفحة (LCP) ضمن ثانيتَين على أنّها "جيدة"، في حين يتم تصنيف قيمة LCP في الشريحة المئوية الخامسة والسبعين التي تبلغ 5 ثوانٍ على أنّها "ضعيفة".

معايير حدود مقاييس "مؤشرات أداء الويب الأساسية"

عند وضع حدود لمقاييس "مؤشرات أداء الويب الأساسية"، حدَّدنا أولاً المعايير التي يجب أن يستوفيها كل حدّ. أشرح أدناه المعايير التي استخدمناها في Google لتقييم الحدود الدنيا لمقاييس "مؤشرات أداء الويب الأساسية" لعام 2020 ستتناول الأقسام التالية المزيد من التفاصيل حول كيفية تطبيق هذه المعايير لاختيار الحدود الدنيا لكل مقياس في العام 2020. نتوقع في السنوات المقبلة إجراء تحسينات وإضافات على المعايير والحدود الدنيا بدرجة أكبر لتحسين قدرتنا على قياس تجارب المستخدمين الرائعة على الويب.

تجربة مستخدم عالية الجودة

هدفنا الأساسي هو تحسين تجربة المستخدم وتعزيز جودة تجربته. بناءً على ذلك، نهدف إلى التأكّد من أنّ الصفحات التي تستوفي معايير "مؤشرات أداء الويب الأساسية" الجيدة تقدّم تجربة عالية الجودة للمستخدم.

لتحديد الحدّ الأدنى لتجربة المستخدم العالية الجودة، نستند إلى التصور البشري وأبحاث HCI. وفي حين يتم تلخيص هذا البحث في بعض الأحيان باستخدام حد ثابت واحد، وجدنا أن البحث الأساسي يتم التعبير عنه عادةً كنطاق من القيم. على سبيل المثال، يتم أحيانًا وصف البحث المتعلق بمقدار الوقت الذي ينتظره المستخدمون عادةً قبل فقدان التركيز على أنّه ثانية واحدة، بينما يتم التعبير عن البحث الأساسي في الواقع على أنّه نطاق، يتراوح من مئات المللي ثانية إلى عدة ثوانٍ. حقيقة أنّ حدود الإدراك تختلف حسب المستخدم والسياق، تتوفّر المزيد من الدعم من خلال بيانات مقاييس Chrome المجمَّعة ومخفية الهوية، والتي توضِّح أنّه ما مِن فترة زمنية واحدة ينتظر المستخدمون خلالها صفحة ويب لعرض المحتوى قبل إلغاء تحميل الصفحة. بدلاً من ذلك، تظهر هذه البيانات توزيعًا سلسًا ومستمرًا. لإلقاء نظرة أكثر تفصيلاً على حدود التصور البشري وأبحاث HCI ذات الصلة، يمكنك الاطّلاع على مقالة العلوم الحيوية وراء الويب.

في الحالات التي يتوفر فيها أبحاث حول تجربة المستخدم ذات صلة بمقياس معيّن وكان هناك إجماع معقول حول نطاق القيم في الأعمال الأدبية، نستخدم هذا النطاق كمدخل لتوجيه عملية اختيار العتبة. في الحالات التي لا يتوفّر فيها بحث ذي صلة لتجربة المستخدم، مثل مقياس جديد مثل "متغيّرات التصميم التراكمية"، نقيّم بدلاً من ذلك الصفحات الواقعية التي تستوفي حدودًا مختلفة مرشحة لمقياس معيّن، وذلك من أجل تحديد الحدّ الأدنى الذي يؤدي إلى تقديم تجربة جيدة للمستخدم.

يمكن تحقيقه من خلال محتوى ويب موجود

بالإضافة إلى ذلك، لضمان نجاح مالكي المواقع الإلكترونية في تحسين مواقعهم لاستيفاء الحدود "الجيدة"، نشترط أن تكون هذه الحدود قابلة للتحقيق في المحتوى الحالي على الويب. على سبيل المثال، على الرغم من أنّ القيمة الصفرية للملي ثانية هي الحدّ المثالي لمقياس LCP "جيّد"، ما يؤدي إلى توفير تجارب تحميل فورية، إلا أنّ الحدّ الأدنى للملي ثانية غير قابل للتحقيق عمليًا في معظم الحالات بسبب وقت الاستجابة لمعالجة الشبكة والأجهزة. وبالتالي، إنّ الصفر الملي ثانية ليس حدًّا معقولاً "جيّدًا" لمقياس LCP بالنسبة إلى "مؤشرات أداء الويب الأساسية".

عند تقييم معايير "جيدة" في "مؤشرات أداء الويب الأساسية" المرشحة، نتأكد من أنّ هذه الحدود قابلة للتحقيق استنادًا إلى البيانات الواردة في تقرير تجربة المستخدم في Chrome (CrUX). للتأكّد من إمكانية تحقيق حدّ معيّن، نشترط استيفاء حاليًا %10 على الأقل من المراجع من الحدّ الأدنى "الجيد". بالإضافة إلى ذلك، لضمان عدم تصنيف المواقع الإلكترونية المحسَّنة بشكل جيد بسبب التباين في بيانات الحقول، نتحقّق أيضًا من أنّ المحتوى الذي تم تحسينه جيدًا يستوفي دائمًا الحدّ الأدنى "جيد".

في المقابل، نحدّد الحدّ الأدنى "ضعيفًا" من خلال تحديد مستوى أداء لا يستوفيه حاليًا عدد قليل من الأصول. ما لم هناك بحث متاح ذي صلة بتحديد الحدّ الأدنى "ضعيف"، يتم تلقائيًا تصنيف الأسوأ 10 إلى% 30 من المصادر من حيث الأداء على أنّها "ضعيفة".

أفكار نهائية حول المعايير

عند تقييم حدود المرشح، وجدنا أن المعايير كانت تتعارض في بعض الأحيان مع بعضها البعض. على سبيل المثال، يمكن أن يكون هناك توتر بين إمكانية تحقيق الحد بشكل مستمر وضمان توفير تجارب جيدة للمستخدم بشكل مستمر. بالإضافة إلى ذلك، ونظرًا لأن أبحاث التصور البشري توفِّر عادةً مجموعة من القيم، وتُظهر مقاييس سلوك المستخدم تغييرات تدريجية في السلوك، وجدنا أنّه في كثير من الأحيان لا يوجد حدّ واحد "صحيح" للمقياس. وبالتالي، كان نهجنا في ما يخص "مؤشرات أداء الويب الأساسية" لعام 2020 هو اختيار الحدود التي تستوفي المعايير السابقة على أفضل وجه، مع إدراك أنّه ما من حدّ أدنى واحد مثالي وأنّه قد نحتاج أحيانًا إلى الاختيار من بين عدة حدود معقولة للمرشحين. بدلاً من طرح السؤال "ما الحد الأدنى المثالي"؟

اختيار الشريحة المئوية

كما ذكرنا سابقًا، نستخدم القيمة المئوية الخامسة والسبعين لجميع الزيارات إلى الصفحة أو الموقع الإلكتروني لتصنيف الأداء العام لصفحة أو موقع إلكتروني. وقد تم اختيار النسبة المئوية الخامسة والسبعين استنادًا إلى معيارين. أولاً، ينبغي أن تضمن النسبة المئوية أن معظم الزيارات إلى صفحة أو موقع قد شهدت مستوى الأداء المستهدف. ثانيًا، ينبغي ألا تتأثر القيمة عند النسبة المئوية المختارة بالقيم المتطرفة بشكل مفرط.

هذه الأهداف تتعارض إلى حد ما مع بعضها البعض. لتحقيق الهدف الأول، عادةً ما تكون النسبة المئوية الأعلى خيارًا أفضل. ومع ذلك، مع ارتفاع النسبة المئوية، تزداد أيضًا احتمالية تأثر القيمة الناتجة بالقيم الخارجية. وإذا كانت بضع زيارات إلى أحد المواقع الإلكترونية تتم من خلال اتصالات الشبكة غير المستقرة، ما يؤدي إلى ظهور عينات من سرعة عرض أكبر محتوى مرئي (LCP) كبيرة للغاية، لا نريد أن يتم تحديد تصنيف موقعنا الإلكتروني من خلال هذه العينات الخارجية. على سبيل المثال، إذا قيّمنا أداء موقع إلكتروني حصل على 100 زيارة باستخدام نسبة مئوية مرتفعة مثل الموقع 95، سيتطلّب الأمر 5 عينات مختلفة فقط لتتأثّر قيمة الشريحة المئوية الـ 95 بالقيم الشاذّة.

بالنظر إلى وجود احتمالات بعض هذه الأهداف، فبعد التحليل، توصلنا إلى أن الشريحة المئوية الخامسة والسبعين تحقق توازنًا معقولاً. وباستخدام الشريحة المئوية الخامسة والسبعين، يمكننا معرفة أنّ معظم الزيارات إلى الموقع الإلكتروني (3 من 4) شهدت مستوى الأداء المستهدَف أو أفضل. بالإضافة إلى ذلك، تقل احتمالية أن تتأثر القيمة المئوية الخامسة والسبعين بالقيم الخارجية. بالعودة إلى مثالنا، بالنسبة إلى الموقع الإلكتروني الذي يسجّل 100 زيارة، ستحتاج 25 زيارة من هذه الزيارات إلى الإبلاغ عن عينات استثنائية كبيرة للقيمة الموجودة عند الشريحة المئوية الخامسة والسبعين المتأثرة بالقيم المتطرفة. في حين أن 25 عينة من أصل 100 عينة هي قيم استثنائية ممكنة، فإنها أقل احتمالاً منها بالنسبة إلى حالة الشريحة المئوية الخامسة والتسعين.

سرعة عرض أكبر جزء من المحتوى على الصفحة

جودة التجربة

غالبًا ما يشار إلى ثانية واحدة على أنها مقدار الوقت الذي سينتظره المستخدم قبل أن يبدأ في فقدان التركيز على المهمة. عند الفحص الدقيق للبحث ذي الصلة، وجدنا أن الثانية الواحدة هي تقدير تقريبي لوصف مجموعة من القيم، تتراوح من عدة مئات من المللي ثانية تقريبًا إلى عدة ثوان.

هناك مصدران يُستشهدان عادةً بالحدّ الأدنى البالغ ثانية واحدة هما Card et al وMiller. تحدد البطاقة حد "الاستجابة الفورية" لمدة ثانية واحدة، مستشهدة بمقالة النظريات الموحدة للإدراك التي وضعها "نيويل". ويشرح نيويل الردود الفورية على أنّها "ردود يجب تقديمها لبعض المحفّزات في غضون ثانية واحدة تقريبًا (أيّ من 0.3 ثانية تقريبًا إلى 3 ثوانٍ تقريبًا"). ويأتي هذا بعد مناقشة نيويل حول "قيود الوقت الفعلي على الإدراك"، حيث تمت ملاحظة أن "التفاعلات مع البيئة التي تستدعي الاعتبارات المعرفية تحدث بترتيب الثواني" والتي تتراوح من 0.5 إلى 2-3 ثوانٍ تقريبًا. يشير "ميلر"، وهو مصدر آخر يُستشهد به عادةً إلى حد الثانية، إلى أن "المهام التي يمكن للإنسان أداؤها وسوف يؤديها باستخدام الاتصالات الآلية ستغير شخصيتها بشكل كبير إذا كانت تأخيرات الاستجابة أكبر من ثانيتين، مع بعض التمديد المحتمل لثانية أخرى أو نحو ذلك".

يصف بحث "ميلر" و"كارد" مقدار الوقت الذي سينتظره المستخدم قبل أن يفقد التركيز كنطاق، من 0.3 إلى 3 ثوانٍ تقريبًا، ما يشير إلى أنّ الحد الأدنى "الجيد" لمقياس LCP يجب أن يكون ضمن هذا النطاق. بالإضافة إلى ذلك، بما أنّ الحدّ الأدنى الحالي لمقياس "سرعة عرض أكبر جزء من المحتوى على الصفحة" (LCP) هو ثانية واحدة، وأنّ سرعة عرض أكبر جزء من المحتوى على الصفحة يتم عادةً بعد سرعة عرض أول محتوى مرئي، نفرض قيودًا على نطاق حدود سرعة عرض أكبر جزء من المحتوى على الصفحة (LCP) المرشحة، تتراوح من ثانية واحدة إلى 3 ثوانٍ. لاختيار الحدّ الأدنى في هذا النطاق الذي يفي بمعاييرنا على أفضل وجه، ننظر في إمكانية تحقيق هذه الحدود الدنيا أدناه.

القابلية للتحقيق

باستخدام بيانات من CrUX، يمكننا تحديد النسبة المئوية للمصادر على الويب التي تستوفي حدود LCP "الجيدة" للمرشحين.

النسبة المئوية لمصادر CrUX المصنَّفة على أنّها "جيدة" (لحدود LCP المرشحة)

	ثانية واحدة	ثانية ونصف	ثانيتان	ثانيتان ونصف	3 ثوانٍ
phone	3.5%	13%	27%	42‏%	55%
كمبيوتر مكتبي	6.9%	19%	36%	51%	64%

على الرغم من أنّ أقل من% 10 من المصادر تستوفي الحدّ الأدنى الذي يفرضه البرنامج الذي تبلغ مدته ثانية واحدة، إنّ جميع الحدود الأخرى التي تتراوح ما بين 1.5 و3 ثوانٍ تستوفي شرطنا الذي يقضي بأنّ% 10 على الأقل من المصادر تستوفي الحد الأدنى "الجيد"، وبالتالي فهي لا تزال مرشحة صالحة.

بالإضافة إلى ذلك، لضمان إمكانية تحقيق الحدّ الأدنى الذي تم اختياره بشكل متّسق للمواقع الإلكترونية المحسّنة، نحلّل أداء مقياس LCP للمواقع الإلكترونية الأفضل أداءً على الويب لتحديد الحدود الدنيا التي يمكن تحقيقها باستمرار لهذه المواقع الإلكترونية. ونهدف على وجه التحديد إلى تحديد حد أدنى يمكن تحقيقه باستمرار عند نسبة 75 في المئة للمواقع الإلكترونية الأفضل أداءً. نجد أن الحد الأدنى البالغ 1.5 وثانيتين غير قابلين للتحقيق باستمرار، في حين أن 2.5 ثانية قابلة للتحقيق باستمرار.

لتحديد الحدّ "الضعيف" لمقياس LCP، نستخدم بيانات CrUX لتحديد الحد الأدنى الذي تستوفيه معظم المصادر:

النسبة المئوية لأصول تجربة المستخدم المصنَّفة على أنّها "ضعيفة" (بالنسبة إلى حدود سرعة عرض أكبر جزء من المحتوى على الصفحة (LCP) المرشحة)

	3 ثوانٍ	3.5 ثانية	4 ثوانٍ	4.5 ثانية	‫٥ ثوانٍ
phone	45%	35%	26%	20%	15%
كمبيوتر مكتبي	36%	26%	19%	14%	10%

عند استخدام حدّ أدنى مدته 4 ثوانٍ، سيتم تصنيف ما يقرب من% 26 من مصادر الهواتف و21% من المصادر المخصّصة لأجهزة الكمبيوتر المكتبي على أنّها ضعيفة. يندرج هذا ضمن النطاق المستهدف الذي يتراوح بين 10 و30%، لذلك نستنتج أن 4 ثوانٍ هي حد أدنى "ضعيف" مقبول.

استنتجنا أنّ 2.5 ثانية تشير إلى حد معقول من "سرعة عرض أكبر جزء من المحتوى على الصفحة"، و4 ثوانٍ تشير إلى حد أدنى معقول "بضعف" لمقياس "سرعة عرض أكبر جزء من المحتوى على الصفحة".

مهلة الاستجابة الأولى

جودة التجربة

تتطابق الأبحاث بشكل معقول في استنتاج أنّ التأخيرات في التجاوب المرئي التي تصل مدتها إلى 100 ملي ثانية تقريبًا يُنظر إليها على أنّها ناتجة عن مصدر مرتبط، مثل البيانات التي أدخلها المستخدم. يشير ذلك إلى أنّ حدّ "مهلة الاستجابة الأولى" "جيد" لمدة 100 ملي ثانية يكون مناسبًا على الأرجح كحدّ أدنى، فإذا تجاوز وقت المعالجة 100 ملي ثانية، لن تكون هناك فرصة لاكتمال خطوات المعالجة والعرض الأخرى في الوقت المناسب.

يُعرِّف جايكوب نيلسن عادةً ضمن أوقات الاستجابة: الحدود الثلاثة المهمة 0.1 ثانية كالحد الأقصى لشعور المستخدم بأن النظام يستجيب بشكل فوري. تستشهد شركة Nielsen عن "ميلر" و"كارد" اللذان يستشهدان بكتاب "ميخوتي" 1962 بعنوان تصور السببية. في بحث ميشوت، يظهر للمشاركين في التجربة "كائنان على الشاشة. يبدأ الكائن "أ" ويتحرك نحو ب. يتوقف في اللحظة التي يتلامس فيها الحرف B، بينما يبدأ الأخير ويتحرك بعيدًا عن A". يتفاوت ميوت الفاصل الزمني بين وقت توقف الكائن "أ" ووقت بدء الكائن "ب" في الحركة. وجد ميشوت أنه بالنسبة للتأخيرات التي تصل إلى 100 ملي ثانية تقريبًا، يكون لدى المشاركين انطباع بأن الكائن "أ" يسبب حركة الكائن ب. وبالنسبة إلى حالات التأخير التي تتراوح من 100 ملي ثانية إلى 200 ملي ثانية تقريبًا، يكون مفهوم السببية مختلطًا، وبالنسبة إلى التأخيرات التي تزيد عن 200 ملي ثانية، لم يعد من الممكن اعتبار حركة الكائن "ب" ناتجة عن العنصر "أ".

وبالمثل، يعرّف ميلر حد الاستجابة لـ "الاستجابة لتفعيل التحكم" على أنه "إشارة إلى الإجراء الذي يتم منحه، عادةً، من خلال حركة مفتاح أو مفتاح تبديل أو عضو تحكم آخر يشير إلى أنه تم تفعيله فعليًا. يجب النظر إلى هذه الاستجابة ...كجزء من الإجراء الميكانيكي الذي يحفز العامل. مهلة الوقت: لا تزيد عن 0.1 ثانية" أو بعد ذلك "يجب ألا تزيد المهلة بين ضغط المفتاح والملاحظات المرئية عن 0.1 إلى 0.2 ثانية".

وفي الآونة الأخيرة، في كتاب Toward the Temporally Perfect Virtual Button، بحثت شركة Kaaresoja et al التصورات المتزامنة بين لمس الزر الافتراضي على الشاشة التي تعمل باللمس والملاحظات المرئية اللاحقة التي تشير إلى لمس الزر، وذلك لتأخيرات متعددة. عندما كان التأخير بين الضغط على الزر والملاحظات المرئية 85 ملي ثانية أو أقل، أبلغ المشاركون عن ظهور الملاحظات المرئية في وقت واحد مع الضغط على الزر في 75٪ من الوقت. بالإضافة إلى ذلك، بالنسبة إلى حالات التأخير التي تبلغ 100 ملي ثانية أو أقل، أبلغ المشاركون عن جودة عالية منتظمة للضغط على الزر، مع انخفاض الجودة الملموسة لمدة تأخيرات تتراوح بين 100 و150 ملي ثانية ووصولها إلى مستويات منخفضة للغاية لمدة تأخيرات 300 ملي ثانية.

بناءً على ما سبق، نستنتج أنّ البحث يشير إلى نطاق من القيم حوالى 100 ملي ثانية كحدّ أدنى مناسب لـ "مهلة الاستجابة لأوّل إدخال" ضِمن "مؤشرات أداء الويب". بالإضافة إلى ذلك، ولأنّ المستخدمين أبلغوا عن مستويات جودة منخفضة في حالات التأخير التي تبلغ 300 ملي ثانية أو أكثر، يمثّل ذلك الحد الأدنى "ضعيفًا" معقولاً.

القابلية للتحقيق

وباستخدام البيانات المستمَدة من تقرير تجربة المستخدم على Chrome، نحدّد أنّ معظم المصادر على الويب تستوفي الحدّ الأدنى "الجيد" الذي يبلغ 100 ملي ثانية لمهلة الاستجابة الأولى (FID) عند الشريحة المئوية الخامسة والسبعين:

النسبة المئوية من مصادر CrUX مصنّفة على أنّها "جيدة" لحدّ مهلة FID 100 ملي ثانية

	100 ملي ثانية
phone	78%
كمبيوتر مكتبي	>99%

بالإضافة إلى ذلك، نلاحظ أنّ أفضل المواقع الإلكترونية على الويب قادرة على استيفاء هذا الحدّ باستمرار عند الشريحة المئوية الخامسة والسبعين (وغالبًا ما تستوفيه عند النسبة المئوية الـ 95).

بناءً على ما ورد أعلاه، نستنتج أنّ 100 ملي ثانية هي حدّ معقول "جيد" لمهلة الاستجابة الأولى FID.

متغيّرات التصميم التراكمية

جودة التجربة

متغيّرات التصميم التراكمية (CLS) هي مقياس جديد يقيس مقدار تغيّر المحتوى المرئي في الصفحة. بما أنّ متغيّرات التصميم التراكمية (CLS) جديدة، لذا لسنا على دراية بالأبحاث التي يمكنها تحديد حدود هذا المقياس بشكل مباشر. وبالتالي، لتحديد حد يتماشى مع توقعات المستخدمين، قيّمنا الصفحات الواقعية التي تتضمّن مقدارًا مختلفًا من تغيُّر التصميم، وذلك لتحديد أقصى حدّ يُعتبَر مقبولاً على أنّه مقبول قبل أن يتسبّب في حدوث مشاكل كبيرة عند استخدام محتوى الصفحة. أثناء اختبارنا الداخلي، وجدنا أنّ مستويات التحول من 0.15 والأعلى كانت تُعتبر باستمرار مزعجة، في حين كانت التحولات من 0.1 والأقل ملحوظة، ولكنها ليست مزعجة للغاية. وبالتالي، على الرغم من أن متغيّرات التصميم الصفري مثالي، فقد توصلنا إلى أن القيم التي تصل إلى 0.1 هي حدود متغيّرات التصميم التراكمية (CLS) "جيدة".

القابلية للتحقيق

استنادًا إلى بيانات CrUX، يمكننا أن نرى أن ما يقرب من% 50 من الأصول لديها متغيّرات التصميم التراكمية (CLS) تبلغ 0.05 أو أقل.

النسبة المئوية من مصادر CrUX المصنَّفة على أنّها "جيدة" (لحدود متغيّرات التصميم التراكمية (CLS) المرشحة)

	0.05	0.1	0.15
phone	49%	60%	‫69%
كمبيوتر مكتبي	42‏%	59%	‫69%

وفي حين تشير بيانات تقرير تجربة المستخدم على Chrome إلى أنّ القيمة 0.05 قد تكون قيمة "جيدة" لمعيار CLS، ندرك أنّ هناك بعض حالات الاستخدام التي يكون من الصعب فيها حاليًا تجنُّب تغيّرات التصميم المزعجة. على سبيل المثال، بالنسبة إلى المحتوى المضمّن التابع لجهة خارجية، مثل تضمينات وسائل التواصل الاجتماعي، لا يكون ارتفاع المحتوى المضمّن معروفًا في بعض الأحيان إلى أن ينتهي من التحميل، ما قد يؤدي إلى حدوث تغيير في التنسيق أكبر من 0.05. إذًا، نستنتج أنّه على الرغم من أنّ العديد من المصادر تستوفي الحدّ الأدنى البالغ 0.05، إلّا أنّ الحدّ الأدنى صرامة بعض الشيء من متغيّرات التصميم التراكمية (CLS) وهو 0.1 يحقّق توازنًا أفضل بين جودة التجربة والقابلية للتحقيق. نأمل أن تحدّد منظومة الويب المتكاملة من الآن فصاعدًا حلولاً لمعالجة التغييرات في التصميم الناتجة عن التضمينات التابعة لجهات خارجية، ما قد يسمح باستخدام حد أدنى "جيد" من متغيّرات التصميم التراكمية (CLS) يبلغ 0.05 أو 0 في التكرار المستقبلي لمؤشرات الويب الأساسية.

بالإضافة إلى ذلك، لتحديد الحدّ "ضعيف" لمتغيّرات التصميم التراكمية، استخدمنا بيانات CrUX لتحديد الحدّ الذي تستوفيه معظم المصادر:

النسبة المئوية من مصادر CrUX المصنَّفة على أنّها "ضعيفة" (بالنسبة إلى حدود متغيّرات التصميم التراكمية (CLS) المرشحة)

	0.15	0.2	0.25	0.3
phone	31%	25%	20%	18%
كمبيوتر مكتبي	31%	23%	18%	16%

بالنسبة إلى الحدّ الأدنى 0.25، سيتم تصنيف ما يقرب من% 20 من مصادر الهواتف و18% من المصادر المتوافقة مع أجهزة الكمبيوتر المكتبي على أنّها "ضعيفة". يقع هذا ضمن النطاق المستهدف الذي يتراوح بين 10 و30%، لذلك استنتجنا أن 0.25 هي قيمة مقبولة "ضعيفة" للحد الأدنى.