چگونه آستانه معیارهای Core Web Vitals تعریف شد

تحقیق و روش شناسی پشت آستانه های Core Web Vitals

تاریخ انتشار: 21 می 2020

Core Web Vitals مجموعه‌ای از معیارهای میدانی هستند که جنبه‌های مهم تجربه کاربر در دنیای واقعی را در وب اندازه‌گیری می‌کنند. Core Web Vitals شامل معیارها و همچنین آستانه های هدف برای هر معیار است که به توسعه دهندگان کمک می کند تا درک کنند که آیا تجربه سایت آنها "خوب"، "نیاز به بهبود" است یا "ضعیف" است. این پست به طور کلی رویکرد مورد استفاده برای انتخاب آستانه برای معیارهای Core Web Vitals و همچنین نحوه انتخاب آستانه برای هر معیار Core Web Vitals خاص را توضیح خواهد داد.

Refresher: معیارها و آستانه های Core Web Vitals

Core Web Vitals سه معیار است: بزرگترین رنگ محتوایی (LCP)، تعامل با رنگ بعدی (INP) و تغییر چیدمان تجمعی (CLS). هر معیار جنبه متفاوتی از تجربه کاربر را اندازه‌گیری می‌کند: LCP سرعت بارگذاری درک شده را اندازه‌گیری می‌کند و نقطه‌ای را در جدول زمانی بارگذاری صفحه مشخص می‌کند که محتوای اصلی صفحه احتمالاً بارگیری شده است. INP پاسخگویی را اندازه گیری می کند و تجربه ای که کاربران هنگام تلاش برای تعامل با صفحه احساس می کنند را کمی می کند. و CLS ثبات بصری را اندازه گیری می کند و مقدار تغییر طرح غیرمنتظره محتوای صفحه قابل مشاهده را تعیین می کند.

هر معیار Core Web Vitals آستانه‌های مرتبطی دارد که عملکرد را به عنوان «خوب»، «نیاز به بهبود» یا «ضعیف» طبقه‌بندی می‌کند:

بزرگترین توصیه های آستانه رنگ محتواییتعامل با توصیه های آستانه رنگ بعدیتوصیه‌های آستانه تغییر طرح‌بندی تجمعی
خوب بیچاره صدک
بزرگترین رنگ محتوایی ≤2500 میلی‌ثانیه > 4000 میلی‌ثانیه 75
تعامل با Next Paint ≤200 میلی‌ثانیه > 500 میلی‌ثانیه 75
تغییر چیدمان تجمعی ≤0.1 >0.25 75
آستانه های Core Web Vitals

علاوه بر این، برای طبقه بندی عملکرد کلی یک صفحه یا سایت، از ارزش صدک 75 تمام بازدیدهای صفحه در آن صفحه یا سایت استفاده می کنیم. به عبارت دیگر، اگر حداقل 75 درصد از بازدیدهای صفحه از یک سایت، آستانه "خوب" را برآورده کنند، سایت به عنوان دارای عملکرد "خوب" برای آن معیار طبقه بندی می شود. برعکس، اگر حداقل 25 درصد از بازدیدهای صفحه آستانه "ضعیف" را داشته باشند، سایت به عنوان دارای عملکرد "ضعیف" طبقه بندی می شود. بنابراین، برای مثال، یک LCP صدک 75 2 ثانیه به عنوان "خوب" طبقه بندی می شود، در حالی که یک LCP صدک 75 5 ثانیه به عنوان "ضعیف" طبقه بندی می شود.

معیارهای آستانه متریک Core Web Vitals

در این بخش، معیارهای ارزیابی آستانه های متریک Core Web Vitals را بررسی خواهیم کرد. بخش‌های بعدی به جزئیات بیشتری در مورد نحوه اعمال این معیارها برای انتخاب آستانه برای هر معیار می‌پردازد. در سال‌های آینده، ما پیش‌بینی می‌کنیم که برای بهبود بیشتر توانایی خود برای اندازه‌گیری تجربیات عالی کاربران در وب، بهبودها و اضافه‌هایی در معیارها و آستانه‌ها ایجاد کنیم.

تجربه کاربری با کیفیت بالا

هدف اصلی ما بهینه سازی برای کاربر و کیفیت تجربه آنهاست. با توجه به این موضوع، هدف ما تضمین این است که صفحاتی که آستانه‌های «خوب» Core Web Vitals را برآورده می‌کنند، تجربه کاربری با کیفیت بالایی را ارائه می‌کنند.

برای شناسایی یک آستانه مرتبط با تجربه کاربری با کیفیت بالا، ما به ادراک انسانی و تحقیقات HCI نگاه می کنیم. در حالی که این تحقیق گاهی با استفاده از یک آستانه ثابت خلاصه می‌شود، متوجه می‌شویم که تحقیقات اساسی معمولاً به عنوان طیفی از مقادیر بیان می‌شود. به عنوان مثال، تحقیقات در مورد مدت زمانی که کاربران معمولاً قبل از از دست دادن تمرکز منتظر می‌مانند، گاهی اوقات به عنوان 1 ثانیه توصیف می‌شود، در حالی که تحقیقات زیربنایی در واقع به صورت محدوده‌ای از صدها میلی‌ثانیه تا چند ثانیه بیان می‌شود. این واقعیت که آستانه درک بسته به کاربر و زمینه متفاوت است، بیشتر توسط داده‌های متریک کروم جمع‌آوری‌شده و ناشناس پشتیبانی می‌شود، که نشان می‌دهد یک مقدار زمانی وجود ندارد که کاربران قبل از لغو بارگذاری صفحه برای نمایش محتوا منتظر یک صفحه وب باشند. بلکه این داده ها توزیعی هموار و پیوسته را نشان می دهد. برای نگاهی عمیق تر به آستانه های ادراک انسانی و تحقیقات مرتبط HCI، به The Science Behind Web Vitals مراجعه کنید.

در مواردی که تحقیقات مربوط به تجربه کاربر برای یک معیار معین در دسترس است و توافق منطقی در مورد دامنه مقادیر در ادبیات وجود دارد، ما از این محدوده به عنوان ورودی برای هدایت فرآیند انتخاب آستانه استفاده می‌کنیم. در مواردی که تحقیق مربوط به تجربه کاربر در دسترس نیست، مانند معیارهای جدیدی مانند تغییر چیدمان تجمعی، ما در عوض صفحات دنیای واقعی را که آستانه‌های نامزد متفاوتی را برای یک متریک برآورده می‌کنند، ارزیابی می‌کنیم تا آستانه‌ای را که منجر به تجربه کاربری خوب می‌شود، شناسایی کنیم.

با محتوای موجود وب قابل دستیابی است

علاوه بر این، برای اطمینان از اینکه صاحبان سایت می توانند در بهینه سازی سایت های خود برای رسیدن به آستانه های "خوب" موفق شوند، ما نیاز داریم که این آستانه ها برای محتوای موجود در وب قابل دستیابی باشد. برای مثال، در حالی که صفر میلی‌ثانیه یک آستانه ایده‌آل LCP «خوب» است که منجر به تجربه‌های بارگذاری فوری می‌شود، آستانه صفر میلی‌ثانیه به دلیل تأخیرهای پردازش شبکه و دستگاه عملاً در اکثر موارد قابل دستیابی نیست. بنابراین، صفر میلی ثانیه یک آستانه معقول LCP "خوب" برای Core Web Vitals نیست.

هنگام ارزیابی آستانه‌های «خوب» Core Web Vitals نامزد، تأیید می‌کنیم که این آستانه‌ها بر اساس داده‌های گزارش تجربه کاربر Chrome (CrUX) قابل دستیابی هستند. برای تأیید دستیابی به یک آستانه، ما نیاز داریم که حداقل 10٪ از مبداها آستانه "خوب" را داشته باشند. به‌علاوه، برای اطمینان از اینکه سایت‌های بهینه‌شده به دلیل تنوع در داده‌های میدانی اشتباه طبقه‌بندی نمی‌شوند، همچنین تأیید می‌کنیم که محتوای بهینه‌شده به‌طور مداوم آستانه «خوب» را برآورده می‌کند.

برعکس، ما آستانه «ضعیف» را با شناسایی سطحی از عملکرد که فقط تعداد کمی از منشاء آن را برآورده نمی‌کنند، تعیین می‌کنیم. به‌طور پیش‌فرض، 10 تا 30 درصد از مبداهایی که بدترین عملکرد را دارند، به‌عنوان «ضعیف» طبقه‌بندی می‌شوند، مگر اینکه تحقیقات مرتبط با تعریف آستانه «ضعیف» وجود داشته باشد.

اینکه آیا معیارهای یکسان یا متفاوت در هر دستگاه وجود داشته باشد

استفاده از موبایل و دسکتاپ معمولاً از نظر قابلیت های دستگاه و قابلیت اطمینان شبکه دارای ویژگی های بسیار متفاوتی است. این به شدت بر معیارهای "دستیابی" تأثیر می گذارد و بنابراین نشان می دهد که ما باید آستانه های جداگانه ای را برای هر یک در نظر بگیریم.

با این حال، انتظارات کاربران از یک تجربه خوب یا ضعیف به دستگاه بستگی ندارد، حتی اگر معیار دستیابی باشد. به همین دلیل آستانه های توصیه شده Core Web Vitals بر اساس دستگاه تفکیک نمی شوند و از آستانه یکسانی برای هر دو استفاده می شود. این همچنین مزیت دیگری دارد که آستانه ها را ساده تر می کند.

علاوه بر این، دستگاه ها همیشه به خوبی در یک دسته قرار نمی گیرند. آیا این باید بر اساس ضریب شکل دستگاه، قدرت پردازش یا شرایط شبکه باشد؟ داشتن آستانه های یکسان دارای مزیت جانبی اجتناب از این پیچیدگی است.

ماهیت محدودتر دستگاه های تلفن همراه به این معنی است که بسیاری از آستانه ها بر اساس قابلیت دستیابی تلفن همراه تنظیم می شوند. آنها به احتمال زیاد آستانه های تلفن همراه را نشان می دهند - به جای یک آستانه مشترک واقعی در همه انواع دستگاه. با این حال، با توجه به اینکه تلفن همراه اغلب بیشترین ترافیک بیشتر سایت‌ها را تشکیل می‌دهد ، این موضوع کمتر نگران کننده است.

نظرات نهایی در مورد معیارها

هنگام ارزیابی آستانه نامزدها، متوجه شدیم که معیارها گاهی اوقات با یکدیگر در تضاد بودند. برای مثال، می‌تواند تنشی بین آستانه‌ای وجود داشته باشد که دائماً قابل دستیابی است و تجربه‌های کاربر خوب را تضمین می‌کند. علاوه بر این، با توجه به اینکه تحقیقات ادراک انسانی معمولاً طیف وسیعی از مقادیر را ارائه می‌کند و معیارهای رفتار کاربر تغییرات تدریجی در رفتار را نشان می‌دهند، ما دریافتیم که اغلب هیچ آستانه «درست» واحدی برای یک معیار وجود ندارد. بنابراین، رویکرد ما برای Core Web Vitals این بوده است که آستانه‌هایی را انتخاب کنیم که به بهترین وجه معیارها را برآورده می‌کنند، در حالی که تشخیص می‌دهیم که یک آستانه کامل وجود ندارد و ممکن است گاهی لازم باشد از بین آستانه‌های نامزد معقول متعدد انتخاب کنیم. به جای اینکه بپرسید "آستانه کامل چیست؟" ما در عوض روی این سوال تمرکز کردیم که "کدام آستانه نامزد به بهترین وجه به معیارهای ما می رسد؟"

انتخاب صدک

همانطور که قبلا ذکر شد، برای طبقه بندی عملکرد کلی یک صفحه یا سایت، از ارزش صدک 75 تمام بازدیدهای آن صفحه یا سایت استفاده می کنیم. صدک 75 بر اساس دو معیار انتخاب شد. اول، صدک باید اطمینان حاصل کند که اکثر بازدیدکنندگان از یک صفحه یا سایت، سطح عملکرد هدف را تجربه کرده اند. دوم، مقدار در صدک انتخابی نباید بیش از حد تحت تأثیر عوامل پرت قرار گیرد.

این اهداف تا حدودی با یکدیگر در تضاد هستند. برای ارضای هدف اول، یک صدک بالاتر معمولاً انتخاب بهتری است. با این حال، با صدک های بالاتر، احتمال اینکه مقدار حاصل تحت تأثیر مقادیر پرت قرار گیرد نیز افزایش می یابد. اگر چند بازدید از یک سایت روی اتصالات شبکه ورقه‌ای باشد که منجر به نمونه‌های LCP بسیار بزرگ می‌شود، ما نمی‌خواهیم طبقه‌بندی سایت ما با این نمونه‌های پرت تعیین شود. به عنوان مثال، اگر ما عملکرد یک سایت را با 100 بازدید با استفاده از یک صدک بالا مانند 95 ارزیابی کنیم، فقط 5 نمونه پرت نیاز است تا مقدار صدک 95 تحت تاثیر نقاط پرت قرار گیرد.

با توجه به اینکه این اهداف کمی در تضاد هستند، پس از تجزیه و تحلیل، به این نتیجه رسیدیم که صدک 75 تعادل معقولی ایجاد می کند. با استفاده از صدک 75، می دانیم که اکثر بازدیدکنندگان از سایت (3 از 4) سطح عملکرد هدف یا بهتر را تجربه کرده اند. علاوه بر این، مقدار صدک 75 کمتر تحت تأثیر عوامل پرت است. با بازگشت به مثال ما، برای سایتی با 100 بازدید، 25 مورد از این بازدیدها باید نمونه های پرت بزرگ را گزارش کنند تا مقدار در صدک 75 تحت تأثیر عوامل پرت قرار گیرد. در حالی که 25 نمونه از 100 نمونه ممکن است پرت باشند، احتمال آن بسیار کمتر از مورد صدک 95 است.

بزرگترین رنگ محتوایی

آستانه های LCP با کیفیت تجربه و ملاحظات دست یافتنی زیر تعیین شدند.

کیفیت تجربه

1 ثانیه اغلب به عنوان مدت زمانی ذکر می شود که کاربر قبل از اینکه تمرکز خود را روی یک کار از دست بدهد منتظر بماند. با بررسی دقیق تر تحقیقات مربوطه، متوجه شدیم که 1 ثانیه تقریبی برای توصیف طیفی از مقادیر، از تقریباً چند صد میلی ثانیه تا چند ثانیه است.

دو منبع متداول ذکر شده برای آستانه 1 ثانیه عبارتند از Card and others و Miller . Card با استناد به نظریه‌های یکپارچه شناخت نیوول، آستانه ۱ ثانیه‌ای «پاسخ فوری» را تعریف می‌کند. نیوول پاسخ‌های فوری را این‌گونه توضیح می‌دهد: «پاسخ‌هایی که باید به محرک‌هایی در عرض تقریباً یک ثانیه داده شوند (یعنی تقریباً از 0.3 تا 3 ثانیه.» این به دنبال بحث نیوول در مورد "محدودیت های زمان واقعی در شناخت" است، جایی که اشاره می شود که "تعاملات با محیطی که ملاحظات شناختی را برمی انگیزد به ترتیب ثانیه ها انجام می شود" که از حدود 0.5 تا 2-3 ثانیه متغیر است. میلر، منبع دیگری که معمولاً برای آستانه 1 ثانیه ذکر می‌شود، خاطرنشان می‌کند: «کارهایی که انسان‌ها می‌توانند با ارتباطات ماشینی انجام دهند و انجام خواهند داد، در صورتی که تأخیر در پاسخ بیش از دو ثانیه باشد، با احتمال طولانی شدن یک ثانیه یا بیشتر، شخصیت آنها به طور جدی تغییر می‌کند».

تحقیقات میلر و کارت مدت زمانی را که کاربر قبل از از دست دادن تمرکز منتظر می‌ماند به عنوان یک محدوده، از تقریباً 0.3 تا 3 ثانیه توصیف می‌کند، که نشان می‌دهد آستانه "خوب" LCP ما باید در این محدوده باشد. علاوه بر این، با توجه به اینکه آستانه "خوب" First Contentful Paint موجود 1 ثانیه است، و اینکه بزرگترین رنگ محتوایی معمولاً بعد از First Contentful Paint رخ می دهد، ما دامنه آستانه های LCP نامزد خود را بیشتر از 1 ثانیه به 3 ثانیه محدود می کنیم. برای انتخاب آستانه‌ای در این محدوده که به بهترین وجه با معیارهای ما مطابقت دارد، در ادامه به دستیابی به این آستانه‌های نامزد می‌پردازیم.

دست یافتنی

با استفاده از داده‌های CrUX، می‌توانیم درصد مبداهای موجود در وب را تعیین کنیم که آستانه‌های «خوب» LCP نامزد ما را برآورده می‌کنند.

1 ثانیه 1.5 ثانیه 2 ثانیه 2.5 ثانیه 3 ثانیه
تلفن 3.5٪ 13% 27% 42% 55%
دسکتاپ 6.9٪ 19% 36% 51% 64%
% از مبداهای CrUX که از آوریل 2020 برای آستانه های LCP نامزد به عنوان "خوب" طبقه بندی شده اند

در حالی که کمتر از 10٪ از مبداها آستانه 1 ثانیه را برآورده می کنند، همه آستانه های دیگر از 1.5 تا 3 ثانیه شرایط ما را برآورده می کنند که حداقل 10٪ از مبداها آستانه "خوب" را برآورده کنند، و بنابراین هنوز کاندیدای معتبر هستند.

علاوه بر این، برای اطمینان از اینکه آستانه انتخاب شده به طور مداوم برای سایت‌های بهینه‌سازی شده قابل دستیابی است، عملکرد LCP را برای سایت‌های با عملکرد برتر در سراسر وب تجزیه و تحلیل می‌کنیم تا تعیین کنیم که کدام آستانه‌ها به طور مداوم برای این سایت‌ها قابل دستیابی هستند. به طور خاص، هدف ما شناسایی آستانه ای است که به طور مداوم در صدک 75 برای سایت های دارای عملکرد برتر قابل دستیابی است. ما متوجه شدیم که آستانه های 1.5 و 2 ثانیه به طور مداوم قابل دستیابی نیستند، در حالی که 2.5 ثانیه به طور مداوم قابل دستیابی است.

برای شناسایی آستانه «ضعیف» برای LCP، از داده‌های CrUX برای شناسایی آستانه‌ای استفاده می‌کنیم که توسط اکثر مبداها برآورده شده است:

3 ثانیه 3.5 ثانیه 4 ثانیه 4.5 ثانیه 5 ثانیه
تلفن 45% 35% 26% 20% 15%
دسکتاپ 36% 26% 19% 14% 10%
% از مبداهای CrUX که از آوریل 2020 برای آستانه های LCP نامزد به عنوان "ضعیف" طبقه بندی شده اند

برای آستانه 4 ثانیه، تقریباً 26٪ از مبدا تلفن و 21٪ از مبدا دسکتاپ به عنوان ضعیف طبقه بندی می شوند. این در محدوده هدف ما 10-30٪ قرار می گیرد، بنابراین نتیجه می گیریم که 4 ثانیه آستانه "ضعیف" قابل قبولی است.

بنابراین، نتیجه می گیریم که 2.5 ثانیه یک آستانه معقول "خوب" و 4 ثانیه یک آستانه معقول "ضعیف" برای بزرگترین رنگ محتوایی است.

تعامل با Next Paint

آستانه های INP با کیفیت تجربه و ملاحظات دست یافتنی زیر تعیین شدند.

کیفیت تجربه

تحقیقات در نتیجه گیری اینکه تاخیر در بازخورد بصری تا حدود 100 میلی ثانیه به عنوان یک منبع مرتبط، مانند ورودی کاربر، ایجاد می شود، به طور منطقی سازگار است. این نشان می دهد که آستانه "خوب" Interaction ایده آل برای Next Paint نزدیک به این خواهد بود.

یاکوب نیلسن که معمولاً به آن اشاره می‌شود : 3 محدودیت مهم، 0.1 ثانیه را به عنوان محدودیتی برای اینکه کاربر احساس کند سیستم فوراً واکنش نشان می‌دهد، تعریف می‌کند. نیلسن از میلر و کارد استناد می‌کند که میشوت در سال 1962 به «درک علیت» اشاره می‌کند. در تحقیقات Michotte، به شرکت کنندگان آزمایش نشان داده می شود "دو شی روی صفحه نمایش. شی A حرکت می کند و به سمت B حرکت می کند. در لحظه ای که با B تماس پیدا می کند متوقف می شود، در حالی که دومی شروع می شود و از A دور می شود." Michotte فاصله زمانی بین توقف شی A و زمانی که شی B شروع به حرکت می کند تغییر می دهد. Michotte دریافت که برای تاخیرهای تقریباً 100 ms، شرکت کنندگان این تصور را دارند که جسم A باعث حرکت شی B می شود. حرکت جسم B دیگر توسط جسم A ایجاد شده است.

به طور مشابه، میلر یک آستانه پاسخ را برای "پاسخ به فعال سازی کنترل" اینگونه تعریف می کند: "نشان دهنده عملی است که معمولاً با حرکت کلید، سوئیچ یا سایر اعضای کنترلی که سیگنال فعال شدن فیزیکی آن را نشان می دهد ارائه می شود. این پاسخ باید ... درک شود. به عنوان بخشی از عمل مکانیکی ناشی از تأخیر زمانی: حداکثر 0.1 ثانیه» و بعداً «تأخیر بین فشار دادن کلید و بازخورد بصری نباید بیش از 0.1 تا 0.2 ثانیه باشد.

اخیراً، در کتاب Towards the Temporally Perfect Virtual Button ، Kaaresoja و دیگران درک همزمانی بین لمس یک دکمه مجازی روی صفحه لمسی و بازخورد بصری بعدی که نشان می‌دهد دکمه لمس شده است را برای تاخیرهای مختلف بررسی کردند. هنگامی که تاخیر بین فشار دادن دکمه و بازخورد بصری 85 میلی‌ثانیه یا کمتر بود، شرکت‌کنندگان گزارش دادند که بازخورد بصری همزمان با فشار دادن دکمه در 75 درصد مواقع ظاهر می‌شود. علاوه بر این، برای تأخیرهای 100 میلی‌ثانیه یا کمتر، شرکت‌کنندگان کیفیت درک مداوم فشار دکمه را گزارش کردند، کیفیت درک شده برای تأخیرهای 100 میلی‌ثانیه تا 150 میلی‌ثانیه کاهش می‌یابد و برای تأخیرهای 300 میلی‌ثانیه به سطوح بسیار پایین می‌رسد.

با توجه به این، نتیجه می گیریم که تحقیقات به 100 میلی ثانیه به عنوان یک تعامل "خوب" با آستانه رنگ بعدی برای Web Vitals اشاره می کند. علاوه بر این، با توجه به گزارش کاربران سطوح پایین کیفیت برای تأخیرهای 300 میلی‌ثانیه یا بیشتر، در حالت ایده‌آل این آستانه «ضعیف» خواهد بود.

دست یافتنی

با استفاده از داده‌های CrUX، ما تعیین می‌کنیم که اکثر مبداهای موجود در وب، آستانه 200 میلی‌ثانیه INP "خوب" در صدک 75 را برآورده می‌کنند:

100 میلی‌ثانیه 200 میلی‌ثانیه 300 میلی‌ثانیه 400 میلی‌ثانیه 500 میلی‌ثانیه
تلفن 12% 56% 76% 88% 92%
دسکتاپ 83% 96% 98% 99% 99%
٪ از مبداهای CrUX طبقه بندی شده به عنوان "خوب" برای آستانه نامزد INP از ماه مه 2022

ما همچنین توجه بیشتری را به بررسی امکان دسترسی به INP برای دستگاه های تلفن همراه پایین تر، که در آن نسبت بالایی از بازدید از سایت ها را تشکیل می دادند، صرف کردیم. این بیشتر مناسب بودن آستانه 200 میلی ثانیه را تأیید کرد.

با در نظر گرفتن آستانه 100 میلی ثانیه که توسط تحقیقات در مورد کیفیت تجربه و معیارهای دستیابی پشتیبانی می شود، نتیجه می گیریم که 200 میلی ثانیه آستانه معقولی برای تجربیات خوب است.

برای شناسایی آستانه «ضعیف» برای LCP، از داده‌های CrUX برای شناسایی آستانه‌ای استفاده می‌کنیم که توسط اکثر مبداها برآورده شده است:

100 میلی‌ثانیه 200 میلی‌ثانیه 300 میلی‌ثانیه 400 میلی‌ثانیه 500 میلی‌ثانیه
تلفن 88% 44% 24% 12% 8%
دسکتاپ 17% 4% 2% 1% 1%
٪ از مبداهای CrUX طبقه بندی شده به عنوان "ضعیف" برای آستانه INP نامزد از ماه مه 2022

این نشان می دهد که ما می توانیم آستانه "ضعیف" 300 میلی ثانیه داشته باشیم.

با این حال، برخلاف LCP و CLS، INP با محبوبیت همبستگی معکوس دارد - سایت های محبوب تر اغلب پیچیده تر هستند و در نتیجه احتمال INP بالاتر بیشتر می شود. وقتی به 10000 سایت برتر نگاه می کنیم - که اکثریت قریب به اتفاق مرورهای اینترنتی را تشکیل می دهند - تصویر پیچیده تری را می بینیم:

100 میلی‌ثانیه 200 میلی‌ثانیه 300 میلی‌ثانیه 400 میلی‌ثانیه 500 میلی‌ثانیه
تلفن 97% 77% 55% 37% 24%
دسکتاپ 48% 17% 8% 4% 2%
٪ از مبدا CrUX در 10000 برتر طبقه بندی شده به عنوان "ضعیف" برای آستانه INP نامزد از می 2022

در تلفن همراه، آستانه 300 میلی‌ثانیه «ضعیف» اکثر سایت‌های پرطرفدار را به‌عنوان «ضعیف» طبقه‌بندی می‌کند که معیارهای دستیابی ما را افزایش می‌دهد، در حالی که 500 میلی‌ثانیه در محدوده 10 تا 30 درصد سایت‌ها مناسب‌تر است. همچنین لازم به ذکر است که آستانه 200 میلی‌ثانیه «خوب» نیز برای این سایت‌ها سخت‌تر است، اما با توجه به اینکه 23 درصد از سایت‌ها هنوز این آستانه را روی تلفن همراه می‌گذرانند، این آستانه حداقل 10 درصد از معیارهای نرخ عبور ما را نیز پشت سر می‌گذارد.

به همین دلیل نتیجه می گیریم که 200 ms یک آستانه معقول "خوب" برای اکثر سایت ها است و بیشتر از 500 ms یک آستانه معقول "ضعیف" است.

تغییر چیدمان تجمعی

آستانه های CLS با کیفیت تجربه و ملاحظات دست یافتنی زیر تنظیم شدند.

کیفیت تجربه

تغییر چیدمان تجمعی (CLS) معیار جدیدی است که میزان تغییر محتوای قابل مشاهده یک صفحه را اندازه گیری می کند. با توجه به جدید بودن CLS، ما از تحقیقاتی که بتواند به طور مستقیم آستانه های این معیار را تعیین کند، آگاه نیستیم. بنابراین، برای شناسایی آستانه‌ای که با انتظارات کاربر همسو باشد، صفحات دنیای واقعی را با مقادیر مختلف تغییر طرح‌بندی ارزیابی کردیم تا قبل از ایجاد اختلالات قابل‌توجه هنگام مصرف محتوای صفحه، حداکثر مقدار تغییر قابل قبول را تعیین کنیم. در آزمایش داخلی ما، متوجه شدیم که سطوح تغییر از 0.15 و بالاتر به طور مداوم به عنوان اخلال‌کننده تلقی می‌شد، در حالی که تغییرات 0.1 و پایین‌تر قابل‌توجه بود اما بیش از حد مخل نبود. بنابراین، در حالی که تغییر طرح صفر ایده آل است، به این نتیجه رسیدیم که مقادیر تا 0.1 آستانه های CLS "خوب" نامزد هستند.

دست یافتنی

بر اساس داده‌های CrUX، می‌توانیم ببینیم که تقریباً 50٪ از مبداها دارای CLS 0.05 یا کمتر هستند.

0.05 0.1 0.15
تلفن 49% 60% 69%
دسکتاپ 42% 59% 69%
٪ از مبداهای CrUX طبقه بندی شده به عنوان "خوب" برای آستانه های CLS نامزد از آوریل 2020

در حالی که داده‌های CrUX نشان می‌دهد که 0.05 ممکن است یک آستانه معقول CLS "خوب" باشد، ما تشخیص می‌دهیم که برخی موارد استفاده وجود دارد که در آن اجتناب از تغییرات طرح‌بندی مخرب دشوار است. برای مثال، برای محتوای تعبیه‌شده شخص ثالث، مانند جاسازی‌های رسانه‌های اجتماعی، ارتفاع محتوای تعبیه‌شده گاهی اوقات تا زمانی که بارگیری تمام نشده مشخص نمی‌شود، که می‌تواند منجر به تغییر چیدمان بیشتر از 0.05 شود. بنابراین، نتیجه می‌گیریم که در حالی که بسیاری از مبداها آستانه 0.05 را برآورده می‌کنند، آستانه CLS کمی سخت‌تر 0.1 تعادل بهتری بین کیفیت تجربه و دستیابی ایجاد می‌کند. امیدواریم که در آینده، اکوسیستم وب راه‌حل‌هایی را برای رسیدگی به تغییرات طرح‌بندی ناشی از تعبیه‌های شخص ثالث شناسایی کند، که امکان استفاده از آستانه سخت‌گیرانه‌تر CLS "خوب" 0.05 یا 0 را در تکرار بعدی Core Web Vitals فراهم می‌کند. .

علاوه بر این، برای تعیین آستانه ضعیف برای CLS، از داده‌های CrUX برای شناسایی آستانه‌ای استفاده کردیم که توسط اکثر مبداها برآورده شده است:

0.15 0.2 0.25 0.3
تلفن 31% 25% 20% 18%
دسکتاپ 31% 23% 18% 16%
% از مبداهای CrUX که از آوریل 2020 برای آستانه های نامزد CLS به عنوان "ضعیف" طبقه بندی شدند

برای آستانه 0.25، تقریباً 20٪ از مبدا تلفن، و 18٪ از مبدا دسکتاپ، به عنوان "ضعیف" طبقه بندی می شوند. این در محدوده هدف ما 10-30 درصد است، بنابراین ما به این نتیجه رسیدیم که 0.25 یک آستانه قابل قبول "ضعیف" است.