Forschung und Methodik hinter den Core Web Vitals-Grenzwerten
Veröffentlicht: 21. Mai 2020
Die Core Web Vitals sind eine Reihe von Messwerten, mit denen wichtige Aspekte der Nutzerfreundlichkeit im Web gemessen werden. Core Web Vitals umfasst Messwerte sowie Zielgrenzwerte für jeden Messwert, mit denen Entwickler qualitativ beurteilen können, ob die Nutzerfreundlichkeit ihrer Website „gut“, „verbesserungswürdig“ oder „schlecht“ ist. In diesem Beitrag wird der Ansatz erläutert, der bei der Auswahl der Grenzwerte für Core Web Vitals-Messwerte im Allgemeinen verwendet wurde. Außerdem wird beschrieben, wie die Grenzwerte für die einzelnen Core Web Vitals-Messwerte ausgewählt wurden.
Wiederholung: Core Web Vitals-Messwerte und -Grenzwerte
Die Core Web Vitals umfassen drei Messwerte: Largest Contentful Paint (LCP), Interaction to Next Paint (INP) und Cumulative Layout Shift (CLS). Mit jedem Messwert wird ein anderer Aspekt der Nutzerfreundlichkeit gemessen: Der LCP misst die wahrgenommene Ladegeschwindigkeit und markiert den Punkt während des Seitenaufbaus, zu dem der Hauptinhalt einer Seite wahrscheinlich geladen wurde. Der INP misst die Reaktionsfähigkeit und quantifiziert die Nutzererfahrung, wenn sie versuchen, mit der Seite zu interagieren. Der CLS misst die visuelle Stabilität und quantifiziert die Häufigkeit unerwarteter Layoutänderungen des sichtbaren Seiteninhalts.
Jedem Core Web Vitals-Messwert sind Grenzwerte zugeordnet, die die Leistung als „gut“, „verbesserungswürdig“ oder „schlecht“ kategorisieren:
Gut | Schlecht | Perzentil | |
---|---|---|---|
Largest Contentful Paint | ≤ 2.500 ms | > 4.000 ms | 75 |
Interaction to Next Paint | ≤ 200 ms | > 500 ms | 75 |
Cumulative Layout Shift | ≤0.1 | > 0,25 | 75 |
Zur Klassifizierung der Gesamtleistung einer Seite oder Website verwenden wir außerdem den 75. Perzentilwert aller Seitenaufrufe auf dieser Seite oder Website. Wenn also mindestens 75 % der Seitenaufrufe auf einer Website den Grenzwert für „gut“ erreichen, wird die Website für diesen Messwert als „gut“ eingestuft. Wenn dagegen mindestens 25 % der Seitenaufrufe den Grenzwert für „schlecht“ erreichen, wird die Website als „schlecht“ eingestuft. Ein LCP von 2 Sekunden beim 75. Perzentil wird beispielsweise als „gut“ eingestuft, während ein LCP von 5 Sekunden beim 75. Perzentil als „schlecht“ eingestuft wird.
Kriterien für die Grenzwerte der Core Web Vitals-Messwerte
In diesem Abschnitt geht es um die Kriterien für die Bewertung der Grenzwerte für Core Web Vitals-Messwerte. In den folgenden Abschnitten wird genauer beschrieben, wie diese Kriterien angewendet wurden, um die Grenzwerte für die einzelnen Messwerte auszuwählen. In den kommenden Jahren werden wir die Kriterien und Grenzwerte voraussichtlich verbessern und ergänzen, um die Nutzerfreundlichkeit im Web noch besser messen zu können.
Hochwertige Nutzererfahrung
Unser primäres Ziel ist es, die Nutzerfreundlichkeit zu optimieren. Daher möchten wir dafür sorgen, dass Seiten, die die Grenzwerte für „gut“ bei den Core Web Vitals einhalten, eine hohe Nutzerfreundlichkeit bieten.
Um einen Grenzwert für eine hochwertige Nutzererfahrung zu ermitteln, beziehen wir uns auf die menschliche Wahrnehmung und die HCI-Forschung. Diese Studien werden manchmal mit einem einzigen festen Grenzwert zusammengefasst. Wir haben jedoch festgestellt, dass die zugrunde liegenden Studien in der Regel als Wertebereich ausgedrückt werden. So wird beispielsweise die Zeit, die Nutzer in der Regel warten, bevor sie den Fokus verlieren, manchmal mit einer Sekunde angegeben, während die zugrunde liegende Forschung tatsächlich einen Bereich von Hunderten von Millisekunden bis zu mehreren Sekunden angibt. Die Tatsache, dass die Wahrnehmungsgrenzwerte je nach Nutzer und Kontext variieren, wird durch aggregierte und anonymisierte Chrome-Messdaten gestützt. Diese zeigen, dass Nutzer nicht immer gleich lange warten, bis auf einer Webseite Inhalte angezeigt werden, bevor sie den Seitenaufbau abbrechen. Stattdessen zeigen diese Daten eine glatte und kontinuierliche Verteilung. Weitere Informationen zu den Wahrnehmungsgrenzen des Menschen und zu relevanten HCI-Forschungen finden Sie unter Die Wissenschaft hinter Web Vitals.
Wenn für einen bestimmten Messwert relevante Studien zur Nutzererfahrung verfügbar sind und in der Literatur ein angemessener Konsens über den Wertebereich besteht, verwenden wir diesen Bereich als Input für die Auswahl des Grenzwerts. Wenn keine relevanten Studien zur Nutzerfreundlichkeit verfügbar sind, z. B. für einen neuen Messwert wie den kumulativen Layout-Shift, bewerten wir stattdessen reale Seiten, die verschiedene Grenzwerte für einen Messwert erfüllen, um einen Grenzwert zu ermitteln, der zu einer guten Nutzerfreundlichkeit führt.
Mit vorhandenen Webinhalten erreichbar
Damit Websiteinhaber ihre Websites so optimieren können, dass sie die Grenzwerte für „gut“ erreichen, müssen diese Grenzwerte für vorhandene Inhalte im Web erreichbar sein. Null Millisekunden ist beispielsweise ein idealer LCP-Grenzwert für „gut“, der zu einem sofortigen Laden führt. Aufgrund von Netzwerk- und Geräteverarbeitungslatenzen ist ein Grenzwert von null Millisekunden in den meisten Fällen jedoch nicht praktisch erreichbar. Null Millisekunden ist daher kein angemessener Grenzwert für „gut“ bei LCP für Core Web Vitals.
Bei der Bewertung der Grenzwerte für „gute“ Core Web Vitals prüfen wir anhand der Daten aus dem Bericht zur Nutzererfahrung in Chrome (Chrome User Experience, CrUX), ob diese Grenzwerte erreichbar sind. Damit ein Schwellenwert erreichbar ist, müssen mindestens 10 % der Quellen den Schwellenwert „gut“ erreichen. Außerdem prüfen wir, ob gut optimierte Websites aufgrund von Schwankungen bei den Felddaten nicht falsch klassifiziert werden. Dazu prüfen wir, ob gut optimierte Inhalte den Grenzwert „gut“ durchgehend erreichen.
Umgekehrt legen wir den Grenzwert für „schlecht“ fest, indem wir ein Leistungsniveau ermitteln, das nur eine Minderheit der Ursprünge nicht erreicht. Sofern keine Studien zur Definition eines Grenzwerts für „schlecht“ verfügbar sind, werden standardmäßig die 10 bis 30% der Quellen mit der schlechtesten Leistung als „schlecht“ eingestuft.
Ob dieselben oder unterschiedliche Kriterien pro Gerät gelten sollen
Die Nutzung auf Mobilgeräten und Computern unterscheidet sich in der Regel in Bezug auf Gerätefunktionen und Netzwerkzuverlässigkeit. Das wirkt sich stark auf die Kriterien für die „Umsetzbarkeit“ aus und wir sollten daher separate Grenzwerte für jedes Kriterium in Betracht ziehen.
Die Erwartungen der Nutzer an eine gute oder schlechte Nutzererfahrung sind jedoch nicht vom Gerät abhängig, auch wenn die Kriterien für die Erzielbarkeit dies sind. Aus diesem Grund sind die empfohlenen Grenzwerte für Core Web Vitals nicht nach Gerät getrennt und für beide wird derselbe Grenzwert verwendet. Außerdem sind die Grenzwerte so leichter verständlich.
Außerdem lassen sich Geräte nicht immer eindeutig einer Kategorie zuordnen. Sollte dies auf dem Formfaktor des Geräts, der Verarbeitungsleistung oder den Netzwerkbedingungen basieren? Die Verwendung derselben Grenzwerte hat den Nebeneffekt, dass diese Komplexität vermieden wird.
Aufgrund der Einschränkungen von Mobilgeräten werden die meisten Grenzwerte daher anhand der Machbarkeit auf Mobilgeräten festgelegt. Sie stellen eher Grenzwerte für Mobilgeräte dar als einen gemeinsamen Grenzwert für alle Gerätetypen. Da bei den meisten Websites jedoch die meisten Zugriffe über Mobilgeräte erfolgen, ist dies weniger problematisch.
Schlussgedanken zu den Kriterien
Bei der Bewertung der Grenzwerte für Kandidaten haben wir festgestellt, dass die Kriterien manchmal im Widerspruch zueinander stehen. Es kann beispielsweise ein Spannungsverhältnis zwischen der Konsistenz der Erreichbarkeit eines Grenzwerts und der Konsistenz der Nutzerfreundlichkeit geben. Da Studien zur menschlichen Wahrnehmung in der Regel einen Wertebereich liefern und Messwerte zum Nutzerverhalten allmähliche Veränderungen im Verhalten zeigen, gibt es oft keinen einzelnen „richtigen“ Grenzwert für einen Messwert. Daher haben wir uns bei den Core Web Vitals für Grenzwerte entschieden, die die Kriterien am besten erfüllen. Wir sind uns jedoch bewusst, dass es keinen perfekten Grenzwert gibt und dass wir manchmal aus mehreren vernünftigen Grenzwerten auswählen müssen. Anstatt uns zu fragen: „Was ist der perfekte Grenzwert?“, haben wir uns darauf konzentriert, herauszufinden: „Welcher Grenzwert für Kandidaten erfüllt unsere Kriterien am besten?“
Perzentil auswählen
Wie bereits erwähnt, verwenden wir den 75. Perzentilwert aller Besuche einer Seite oder Website, um die Gesamtleistung zu klassifizieren. Der 75. Perzentil wurde anhand von zwei Kriterien ausgewählt. Erstens sollte der Prozentsatz dafür sorgen, dass bei der Mehrheit der Besuche einer Seite oder Website die angestrebte Leistung erreicht wird. Zweitens sollte der Wert beim ausgewählten Perzentil nicht übermäßig von Ausreißern beeinflusst werden.
Diese Ziele stehen etwas im Widerspruch zueinander. Um das erste Ziel zu erreichen, ist in der Regel ein höheres Prozentil die bessere Wahl. Mit höheren Perzentilwerten steigt jedoch auch die Wahrscheinlichkeit, dass der resultierende Wert von Ausreißern beeinflusst wird. Wenn einige Besuche einer Website über fehlerhafte Netzwerkverbindungen erfolgen, was zu übermäßig großen LCP-Beispielen führt, soll die Websiteklassifizierung nicht von diesen Ausreißerbeispielen beeinflusst werden. Wenn wir beispielsweise die Leistung einer Website mit 100 Besuchen anhand eines hohen Perzentils wie dem 95. Perzentil bewerten, reichen bereits fünf Ausreißerproben aus, um den Wert des 95. Perzentils zu beeinflussen.
Da diese Ziele etwas im Widerspruch stehen, sind wir nach der Analyse zu dem Schluss gekommen, dass der 75. Perzentilwert ein angemessenes Gleichgewicht darstellt. Wenn wir den 75. Perzentil verwenden, wissen wir, dass bei den meisten Besuchen der Website (3 von 4) die Zielleistung oder eine bessere Leistung erreicht wurde. Außerdem ist der Wert für das 75. Perzentil weniger wahrscheinlich von Ausreißern betroffen. Zurück zu unserem Beispiel: Bei einer Website mit 100 Besuchen müssten für 25 dieser Besuche große Ausreißerproben gemeldet werden, damit der Wert beim 75. Perzentil von Ausreißern betroffen ist. Es ist zwar möglich, dass 25 von 100 Stichproben Ausreißer sind, aber dies ist viel unwahrscheinlicher als beim 95. Perzentil.
Largest Contentful Paint
Die LCP-Grenzwerte wurden unter Berücksichtigung der folgenden Aspekte zur Nutzerfreundlichkeit und Erzielbarkeit festgelegt.
Nutzerfreundlichkeit
Eine Sekunde wird oft als die Zeitspanne angegeben, die ein Nutzer wartet, bevor er den Fokus auf eine Aufgabe verliert. Bei einer genaueren Prüfung der relevanten Studien haben wir festgestellt, dass 1 Sekunde eine Näherung ist, um einen Bereich von Werten von etwa mehreren hundert Millisekunden bis zu mehreren Sekunden zu beschreiben.
Zwei häufig zitierte Quellen für den Grenzwert von einer Sekunde sind Card und andere und Miller. Card definiert einen Grenzwert von 1 Sekunde für eine „sofortige Antwort“ und verweist dabei auf Newells Unified Theories of Cognition. Newell erklärt unmittelbare Reaktionen als „Reaktionen, die auf einen Reiz innerhalb von ungefähr einer Sekunde erfolgen müssen (d. h. etwa von 0,3 Sekunden bis 3 Sekunden)“. Dies folgt Newells Diskussion über „Echtzeiteinschränkungen der Kognition“, in der darauf hingewiesen wird, dass „Interaktionen mit der Umgebung, die kognitive Überlegungen hervorrufen, in der Größenordnung von Sekunden stattfinden“, was etwa 0,5 bis 2–3 Sekunden entspricht. Miller, eine weitere häufig zitierte Quelle für die 1-Sekunden-Grenze, stellt fest, dass „Aufgaben, die Menschen mithilfe von Maschinenkommunikation ausführen können und werden, sich erheblich ändern, wenn die Antwortverzögerung mehr als zwei Sekunden beträgt, mit einer möglichen Verlängerung um etwa eine weitere Sekunde.“
Die Forschung von Miller und Card beschreibt die Zeit, die ein Nutzer wartet, bevor er den Fokus verliert, als Bereich von etwa 0,3 bis 3 Sekunden.Das bedeutet, dass unser LCP-Grenzwert für „gut“ in diesem Bereich liegen sollte. Da der bestehende Grenzwert für „gut“ bei First Contentful Paint eine Sekunde beträgt und der Largest Contentful Paint in der Regel nach dem First Contentful Paint erfolgt, beschränken wir den Bereich der LCP-Grenzwerte von 1 Sekunde auf 3 Sekunden. Um den Schwellenwert in diesem Bereich auszuwählen, der unsere Kriterien am besten erfüllt, sehen wir uns als Nächstes die Erreichbarkeit dieser Kandidaten an.
Umsetzbarkeit
Anhand von CrUX-Daten können wir den Prozentsatz der Ursprünge im Web ermitteln, die unsere Grenzwerte für „gute“ LCP-Kandidaten erfüllen.
1 Sekunde | 1,5 Sekunden | 2 Sekunden | 2,5 Sekunden | 3 Sekunden | |
---|---|---|---|---|---|
phone | 3,5% | 13 % | 27 % | 42 % | 55 % |
desktop | 6,9 % | 19 % | 36 % | 51 % | 64 % |
Bei weniger als 10% der Ursprünge wird der Grenzwert von 1 Sekunde erreicht. Alle anderen Grenzwerte von 1, 5 bis 3 Sekunden erfüllen jedoch unsere Anforderung, dass mindestens 10% der Ursprünge den Grenzwert „gut“ erreichen. Sie sind also weiterhin als Kandidaten zulässig.
Außerdem analysieren wir die LCP-Leistung der leistungsstärksten Websites im Web, um sicherzustellen, dass der ausgewählte Grenzwert für gut optimierte Websites regelmäßig erreicht wird. Insbesondere möchten wir einen Schwellenwert ermitteln, der bei den leistungsstärksten Websites im 75. Perzentil konstant erreicht wird. Wir haben festgestellt, dass die Grenzwerte von 1,5 und 2 Sekunden nicht immer erreicht werden können, während 2,5 Sekunden immer erreicht werden.
Um einen Grenzwert für „schlecht“ für LCP zu ermitteln, verwenden wir CrUX-Daten, um einen Grenzwert zu ermitteln, der von den meisten Ursprüngen erfüllt wird:
3 Sekunden | 3,5 Sekunden | 4 Sekunden | 4,5 Sekunden | 5 Sekunden | |
---|---|---|---|---|---|
phone | 45 % | 35 % | 26 % | 20 % | 15 % |
desktop | 36 % | 26 % | 19 % | 14 % | 10 % |
Bei einem Grenzwert von 4 Sekunden würden etwa 26% der Zugriffe über Smartphones und 21% der Zugriffe über Computer als schlecht eingestuft. Das entspricht unserem Zielbereich von 10–30 %. Wir schließen daraus, dass 4 Sekunden ein akzeptabler Grenzwert für „schlecht“ ist.
Wir schließen daraus, dass 2, 5 Sekunden ein angemessener Grenzwert für „gut“ und 4 Sekunden ein angemessener Grenzwert für „schlecht“ für Largest Contentful Paint sind.
Interaction to Next Paint
Die INP-Grenzwerte wurden unter Berücksichtigung der folgenden Aspekte festgelegt: Nutzerfreundlichkeit und Erzielbarkeit.
Nutzerfreundlichkeit
Die Forschung kommt ziemlich einheitlich zu dem Schluss, dass Verzögerungen beim visuellen Feedback von bis zu etwa 100 ms als von einer zugehörigen Quelle verursacht wahrgenommen werden, z. B. von einer Nutzereingabe. Das deutet darauf hin, dass ein idealer Grenzwert für „gut“ bei „Interaction to Next Paint“ in der Nähe dieses Werts liegen sollte.
In Jakob Nielsens oft zitiertem Artikel Response Times: The 3 Important Limits (Antwortzeiten: Die 3 wichtigen Grenzwerte) wird 0,1 Sekunde als Grenzwert definiert, ab dem Nutzer das Gefühl haben, dass das System sofort reagiert. Nielsen zitiert Miller und Card, die sich auf Michottes The Perception of Causality (Die Wahrnehmung von Kausalität) aus dem Jahr 1962 beziehen. In Michottes Forschung wurden den Testteilnehmern „zwei Objekte auf einem Bildschirm“ präsentiert. Objekt A startet und bewegt sich auf Objekt B zu. Es bleibt stehen, wenn es mit B in Kontakt kommt, während dieses dann startet und sich von A entfernt.“ Michotte variiert das Zeitintervall zwischen dem Stopp von Objekt A und dem Start von Objekt B. Michotte stellt fest, dass die Teilnehmer bei Verzögerungen von bis zu etwa 100 ms den Eindruck haben, dass Objekt A die Bewegung von Objekt B verursacht. Bei Verzögerungen von etwa 100 ms bis 200 ms ist die Wahrnehmung der Kausalität gemischt. Bei Verzögerungen von über 200 ms wird die Bewegung von Objekt B nicht mehr als von Objekt A verursacht wahrgenommen.
Ähnlich definiert Miller einen Reaktionsgrenzwert für „Reaktion auf die Aktivierung der Steuerung“ als „die Angabe einer Aktion, die normalerweise durch die Bewegung eines Schlüssels, Schalters oder anderen Steuerelements erfolgt, das signalisiert, dass es physisch aktiviert wurde. Diese Reaktion sollte als Teil der mechanischen Aktion wahrgenommen werden, die vom Bediener ausgelöst wird. Zeitverzögerung: maximal 0,1 Sekunde“ und später „Die Verzögerung zwischen dem Drücken einer Taste und dem visuellen Feedback sollte maximal 0,1 bis 0,2 Sekunden betragen“.
In ihrem kürzlich erschienenen Artikel Towards the Temporally Perfect Virtual Button untersuchten Kaaresoja und andere die Wahrnehmung der Gleichzeitigkeit zwischen dem Berühren einer virtuellen Schaltfläche auf einem Touchscreen und dem anschließenden visuellen Feedback, das darauf hinweist, dass die Schaltfläche berührt wurde, bei verschiedenen Verzögerungen. Bei einer Verzögerung zwischen dem Drücken der Taste und dem visuellen Feedback von 85 ms oder weniger empfanden die Teilnehmer das visuelle Feedback in 75% der Fälle als gleichzeitig mit dem Drücken der Taste. Bei Verzögerungen von 100 ms oder weniger empfanden die Teilnehmer die Qualität des Knopfdrucks durchweg als hoch. Bei Verzögerungen von 100 ms bis 150 ms sank die wahrgenommene Qualität und erreichte bei Verzögerungen von 300 ms sehr niedrige Werte.
Aus diesem Grund gehen wir davon aus, dass 100 ms ein guter Grenzwert für „Interaction to Next Paint“ für Web Vitals ist. Da Nutzer bei Verzögerungen von 300 ms oder mehr eine niedrige Qualität gemeldet haben, sollte dies idealerweise der Grenzwert für „schlecht“ sein.
Umsetzbarkeit
Anhand der Daten aus CrUX haben wir festgestellt, dass die Mehrheit der Ursprünge im Web den Grenzwert von 200 ms für „gut“ beim INP im 75. Perzentil erreicht:
100 ms | 200 ms | 300 ms | 400 ms | 500 ms | |
---|---|---|---|---|---|
phone | 12 % | 56 % | 76 % | 88 % | 92 % |
desktop | 83 % | 96 % | 98 % | 99 % | 99 % |
Außerdem haben wir uns besonders darauf konzentriert, die Durchsetzbarkeit der INP für Mobilgeräte mit niedrigerer Leistung zu prüfen, da diese einen hohen Anteil an Websitebesuchen ausmachen. Dies bestätigte die Eignung eines Schwellenwerts von 200 ms.
Unter Berücksichtigung des Grenzwerts von 100 ms, der durch Studien zur Nutzerfreundlichkeit und den Kriterien für die Erzielbarkeit gestützt wird, sind wir der Meinung, dass 200 ms ein angemessener Grenzwert für eine gute Nutzerfreundlichkeit ist.
Um einen Grenzwert für „schlecht“ für LCP zu ermitteln, verwenden wir CrUX-Daten, um einen Grenzwert zu ermitteln, der von den meisten Ursprüngen erfüllt wird:
100 ms | 200 ms | 300 ms | 400 ms | 500 ms | |
---|---|---|---|---|---|
phone | 88 % | 44 % | 24 % | 12 % | 8 % |
desktop | 17 % | 4 % | 2 % | 1 % | 1 % |
Das bedeutet, dass wir einen Grenzwert von 300 ms für „schlecht“ festlegen können.
Im Gegensatz zu LCP und CLS ist der INP jedoch invers mit der Beliebtheit korreliert. Je beliebter eine Website ist, desto komplexer ist sie oft, was mit höherer Wahrscheinlichkeit zu einem höheren INP führt. Wenn wir uns die 10.000 wichtigsten Websites ansehen, die den Großteil des Internetsurfens ausmachen, ergibt sich ein komplexeres Bild:
100 ms | 200 ms | 300 ms | 400 ms | 500 ms | |
---|---|---|---|---|---|
phone | 97 % | 77 % | 55 % | 37 % | 24 % |
desktop | 48 % | 17 % | 8 % | 4 % | 2 % |
Auf Mobilgeräten würde ein Grenzwert von 300 ms für die Bewertung „schlecht“ die Mehrheit der beliebten Websites als „schlecht“ einstufen, was unsere Kriterien für die Erzielbarkeit überstrapazieren würde. 500 ms passen besser zu 10–30% der Websites. Außerdem ist der Grenzwert von 200 ms für diese Websites strenger. Da aber 23% der Websites diesen Wert auf Mobilgeräten dennoch erreichen, wird unser Mindestkriterium von 10% erfüllt.
Aus diesem Grund sind 200 ms für die meisten Websites ein angemessener Grenzwert für „gut“ und mehr als 500 ms ein angemessener Grenzwert für „schlecht“.
Cumulative Layout Shift
Die CLS-Grenzwerte wurden unter Berücksichtigung der folgenden Aspekte zur Nutzerfreundlichkeit und Erzielbarkeit festgelegt.
Nutzerfreundlichkeit
Der Messwert „Cumulative Layout Shift“ (CLS) ist ein neuer Messwert, mit dem gemessen wird, wie stark sich die sichtbaren Inhalte einer Seite verschieben. Da der CLS neu ist, sind uns keine Studien bekannt, die direkt die Grenzwerte für diesen Messwert beeinflussen könnten. Um einen Grenzwert zu ermitteln, der den Erwartungen der Nutzer entspricht, haben wir reale Seiten mit unterschiedlichen Layoutverschiebungen bewertet, um den maximalen Wert zu ermitteln, der als akzeptabel empfunden wird, bevor es zu erheblichen Unterbrechungen beim Lesen des Seiteninhalts kommt. In unseren internen Tests haben wir festgestellt, dass Abweichungen ab 0,15 Pixeln regelmäßig als störend wahrgenommen wurden, während Abweichungen von 0,1 Pixeln und darunter zwar wahrnehmbar, aber nicht übermäßig störend waren. Daher sind Werte bis zu 0,1 als „gut“ zu betrachten.
Umsetzbarkeit
Die CrUX-Daten zeigen, dass fast 50% der Ursprünge einen CLS von 0,05 oder darunter haben.
0,05 | 0,1 | 0,15 | |
---|---|---|---|
phone | 49 % | 60 % | 69 % |
desktop | 42 % | 59 % | 69 % |
Die CrUX-Daten deuten darauf hin, dass 0,05 ein angemessener Grenzwert für eine „gute“ CLS sein könnte.Wir sind uns jedoch bewusst, dass es einige Anwendungsfälle gibt, in denen es schwierig ist, störende Layoutänderungen zu vermeiden. Bei eingebetteten Inhalten von Drittanbietern, z. B. von Social-Media-Plattformen, ist die Höhe der eingebetteten Inhalte manchmal erst nach dem vollständigen Laden bekannt. Das kann zu einer Layoutverschiebung von mehr als 0,05 führen. Wir schließen daraus, dass viele Ursprünge zwar den Grenzwert von 0,05 erfüllen, der etwas weniger strenge CLS-Grenzwert von 0,1 jedoch ein besseres Gleichgewicht zwischen Qualität und Erreichbarkeit bietet. Wir hoffen, dass im Web in Zukunft Lösungen für Layoutänderungen gefunden werden, die durch Einbettungen von Drittanbietern verursacht werden.So könnte in einer zukünftigen Iteration der Core Web Vitals ein strengerer Grenzwert von 0, 05 oder 0 für „gut“ bei der CLS verwendet werden.
Außerdem haben wir anhand von CrUX-Daten einen Grenzwert für „schlecht“ für CLS ermittelt, der von den meisten Ursprüngen erfüllt wird:
0,15 | 0,2 | 0,25 | 0,3 | |
---|---|---|---|---|
phone | 31 % | 25 % | 20 % | 18 % |
desktop | 31 % | 23 % | 18 % | 16 % |
Bei einem Schwellenwert von 0,25 würden etwa 20% der Zugriffe über Smartphones und 18% der Zugriffe über Computer als „schlecht“ eingestuft. Das liegt in unserem Zielbereich von 10–30 %. Wir haben daher entschieden, dass 0,25 ein akzeptabler Grenzwert für „schlecht“ ist.