So wurden die Grenzwerte für die Core Web Vitals-Messwerte definiert

Forschung und Methodik hinter den Core Web Vitals-Grenzwerten

Bryan McQuade
Bryan McQuade

Veröffentlicht: 21. Mai 2020

Die Core Web Vitals sind eine Reihe von Messwerten, mit denen wichtige Aspekte der Nutzerfreundlichkeit im Web gemessen werden. Core Web Vitals umfasst Messwerte sowie Zielgrenzwerte für jeden Messwert, mit denen Entwickler qualitativ beurteilen können, ob die Nutzerfreundlichkeit ihrer Website „gut“, „verbesserungswürdig“ oder „schlecht“ ist. In diesem Beitrag wird erläutert, wie die Grenzwerte für Core Web Vitals-Messwerte im Allgemeinen ausgewählt werden und wie die Grenzwerte für jeden einzelnen Core Web Vitals-Messwert ausgewählt wurden.

Wiederholung: Core Web Vitals-Messwerte und -Grenzwerte

Die Core Web Vitals umfassen drei Messwerte: Largest Contentful Paint (LCP), Interaction to Next Paint (INP) und Cumulative Layout Shift (CLS). Jeder Messwert misst einen anderen Aspekt der Nutzererfahrung: LCP misst die wahrgenommene Ladegeschwindigkeit und markiert den Punkt auf der Zeitleiste zum Laden der Seite, wenn der Hauptinhalt der Seite wahrscheinlich geladen wurde. INP misst die Reaktionsfähigkeit und quantifiziert die Nutzererfahrung, wenn sie versuchen, mit der Seite zu interagieren. Der CLS misst die visuelle Stabilität und quantifiziert das Ausmaß unerwarteter Layoutverschiebungen sichtbarer Seiteninhalte.

Jedem Core Web Vitals-Messwert sind Grenzwerte zugeordnet, die die Leistung als „gut“, „verbesserungswürdig“ oder „schlecht“ kategorisieren:

Empfehlungen für den Largest Contentful Paint-Grenzwert Empfehlungen für den Grenzwert „Interaction to Next Paint“ Grenzwert-Empfehlungen für Cumulative Layout Shift
  Gut Schlecht Perzentil
Largest Contentful Paint ≤ 2.500 ms > 4.000 ms 75
Interaction to Next Paint ≤ 200 ms > 500 ms 75
Cumulative Layout Shift ≤0.1 > 0,25 75
Grenzwerte für Core Web Vitals

Zur Klassifizierung der Gesamtleistung einer Seite oder Website verwenden wir außerdem den 75. Perzentilwert aller Seitenaufrufe auf dieser Seite oder Website. Wenn also mindestens 75 % der Seitenaufrufe einer Website den Grenzwert für „gut“ erreichen, wird die Website für diesen Messwert als „gut“ eingestuft. Wenn dagegen mindestens 25 % der Seitenaufrufe den Grenzwert für „schlecht“ erreichen, wird die Website als „schlecht“ eingestuft. Ein LCP von 2 Sekunden beim 75. Perzentil wird beispielsweise als „gut“ eingestuft, während ein LCP von 5 Sekunden beim 75. Perzentil als „schlecht“ eingestuft wird.

Kriterien für die Grenzwerte der Core Web Vitals-Messwerte

In diesem Abschnitt geht es um die Kriterien für die Bewertung der Grenzwerte für Core Web Vitals-Messwerte. In den folgenden Abschnitten wird genauer beschrieben, wie diese Kriterien angewendet wurden, um die Grenzwerte für die einzelnen Messwerte auszuwählen. In den kommenden Jahren werden wir die Kriterien und Grenzwerte voraussichtlich verbessern und ergänzen, um die Nutzerfreundlichkeit im Web noch besser messen zu können.

Hochwertige Nutzererfahrung

Unser primäres Ziel ist es, die Nutzerfreundlichkeit zu optimieren. Daher möchten wir dafür sorgen, dass Seiten, die die Grenzwerte für „gut“ bei den Core Web Vitals einhalten, eine hohe Nutzerfreundlichkeit bieten.

Um einen Grenzwert für eine hochwertige Nutzererfahrung zu ermitteln, beziehen wir uns auf die menschliche Wahrnehmung und die HCI-Forschung. Diese Studien werden manchmal mit einem einzigen festen Grenzwert zusammengefasst. Wir haben jedoch festgestellt, dass die zugrunde liegenden Studien in der Regel als Wertebereich ausgedrückt werden. So wird beispielsweise die Zeit, die Nutzer in der Regel warten, bevor sie den Fokus verlieren, manchmal mit einer Sekunde angegeben, während die zugrunde liegende Forschung tatsächlich einen Bereich von Hunderten von Millisekunden bis zu mehreren Sekunden angibt. Die Tatsache, dass die Grenzwerte für die Wahrnehmung je nach Nutzer und Kontext variieren, wird durch aggregierte und anonymisierte Chrome-Messwertdaten weiter gestützt. Diese zeigen, dass Nutzer nicht eine einzige Zeit lang warten müssen, bis Inhalte auf einer Webseite angezeigt werden, bevor der Seitenaufbau abgebrochen wird. Vielmehr zeigen diese Daten eine glatte und kontinuierliche Verteilung. Einen detaillierteren Einblick in die Schwellenwerte der menschlichen Wahrnehmung und relevante HCI-Forschung finden Sie unter The Science Behind Web Viitals.

Wenn relevante Studien zur Nutzererfahrung für einen bestimmten Messwert verfügbar sind und ein angemessener Konsens über den Wertebereich in der Literatur besteht, verwenden wir diesen Bereich als Grundlage für die Auswahl des Schwellenwerts. In Fällen, in denen keine relevanten Studien zur Nutzererfahrung verfügbar sind, z. B. bei einem neuen Messwert wie „Cumulative Layout Shift“, bewerten wir stattdessen echte Seiten, die unterschiedliche Grenzwerte für einen Messwert erreichen, um einen Grenzwert zu ermitteln, der zu einer guten Nutzererfahrung führt.

Mit vorhandenen Webinhalten erreichbar

Damit Websiteinhaber ihre Websites so optimieren können, dass sie die Grenzwerte für „gut“ erreichen, müssen diese Grenzwerte für vorhandene Inhalte im Web erreichbar sein. Null Millisekunden ist beispielsweise ein idealer LCP-Grenzwert für „gut“, der zu einem sofortigen Laden führt. Aufgrund von Netzwerk- und Geräteverarbeitungslatenzen ist dieser Grenzwert in den meisten Fällen jedoch nicht praktisch erreichbar. Null Millisekunden ist daher kein angemessener Grenzwert für „gut“ bei LCP für Core Web Vitals.

Bei der Bewertung der Grenzwerte für „gute“ Core Web Vitals prüfen wir anhand der Daten aus dem Bericht zur Nutzererfahrung in Chrome (Chrome User Experience, CrUX), ob diese Grenzwerte erreichbar sind. Damit ein Schwellenwert erreichbar ist, müssen mindestens 10 % der Quellen den Schwellenwert „gut“ erreichen. Außerdem prüfen wir, ob gut optimierte Websites aufgrund von Schwankungen bei den Felddaten nicht falsch klassifiziert werden. Dazu prüfen wir, ob gut optimierte Inhalte den Grenzwert „gut“ durchgehend erreichen.

Umgekehrt legen wir den Schwellenwert für „schlechte“ fest, indem wir ein Leistungsniveau identifizieren, das nur eine Minderheit der Ursprünge nicht erfüllt. Sofern keine Forschungsergebnisse für die Definition eines „schlechten“ Schwellenwerts verfügbar sind, werden standardmäßig die leistungsschwächsten 10–30% der Ursprünge als „schlecht“ eingestuft.

Ob dieselben oder unterschiedliche Kriterien pro Gerät gelten sollen

Die Nutzung auf Mobilgeräten und Computern unterscheidet sich in der Regel in Bezug auf Gerätefunktionen und Netzwerkzuverlässigkeit. Das wirkt sich stark auf die Kriterien für die „Umsetzbarkeit“ aus und wir sollten daher separate Grenzwerte für jedes Kriterium in Betracht ziehen.

Die Erwartungen der Nutzer an eine gute oder schlechte Nutzererfahrung sind jedoch nicht vom Gerät abhängig, auch wenn die Kriterien für die Erzielbarkeit dies sind. Aus diesem Grund sind die empfohlenen Grenzwerte für Core Web Vitals nicht nach Gerät getrennt und für beide wird derselbe Grenzwert verwendet. Außerdem sind die Grenzwerte so leichter verständlich.

Außerdem lassen sich Geräte nicht immer in eine Kategorie einordnen. Sollte dies auf dem Formfaktor des Geräts, der Verarbeitungsleistung oder den Netzwerkbedingungen basieren? Die Verwendung derselben Grenzwerte hat den Nebeneffekt, dass diese Komplexität vermieden wird.

Aufgrund der Einschränkungen von Mobilgeräten werden die meisten Grenzwerte daher anhand der Machbarkeit auf Mobilgeräten festgelegt. Sie stellen eher die Grenzwerte für Mobilgeräte dar, anstatt einen tatsächlichen gemeinsamen Schwellenwert für alle Gerätetypen. Da jedoch der Großteil der Zugriffe auf Websites über Mobilgeräte erfolgt, ist das kein Problem.

Abschließende Gedanken zu den Kriterien

Bei der Bewertung der Grenzwerte für Kandidaten haben wir festgestellt, dass die Kriterien manchmal im Widerspruch zueinander stehen. Es kann beispielsweise ein Spannungsverhältnis zwischen der Konsistenz der Erreichbarkeit eines Grenzwerts und der Konsistenz der Nutzerfreundlichkeit geben. Da die Forschung zur menschlichen Wahrnehmung in der Regel eine Reihe von Werten liefert und Messwerte zum Nutzerverhalten allmähliche Verhaltensänderungen zeigen, haben wir festgestellt, dass es oft keinen einzigen „richtigen“ Grenzwert für einen Messwert gibt. Daher haben wir uns bei den Core Web Vitals für Grenzwerte entschieden, die die Kriterien am besten erfüllen. Wir sind uns jedoch bewusst, dass es keinen perfekten Grenzwert gibt und dass wir manchmal aus mehreren vernünftigen Grenzwerten auswählen müssen. Anstatt zu fragen, „Was ist der perfekte Schwellenwert?“, haben wir uns eher darauf konzentriert, „mit welcher Bewerberschwelle unsere Kriterien am besten erfüllt werden?“

Perzentil auswählen

Wie bereits erwähnt, verwenden wir zur Klassifizierung der Gesamtleistung einer Seite oder Website den Wert für das 75. Perzentil aller Besuche auf dieser Seite oder Website. Der 75. Perzentil wurde anhand von zwei Kriterien ausgewählt. Erstens sollte der Prozentsatz dafür sorgen, dass bei der Mehrheit der Besuche einer Seite oder Website die angestrebte Leistung erreicht wird. Zweitens sollte der Wert beim ausgewählten Perzentil nicht zu stark von Ausreißern beeinflusst sein.

Diese Ziele stehen etwas im Widerspruch zueinander. Um das erste Ziel zu erfüllen, ist in der Regel ein höheres Perzentil die bessere Wahl. Mit höheren Perzentilwerten steigt jedoch auch die Wahrscheinlichkeit, dass der resultierende Wert von Ausreißern beeinflusst wird. Wenn einige Besuche auf einer Website über unzuverlässige Netzwerkverbindungen verfügen, die zu übermäßig großen LCP-Stichproben führen, möchten wir nicht, dass unsere Websiteklassifizierung anhand dieser Ausreißerstichproben bestimmt wird. Wenn wir beispielsweise die Leistung einer Website mit 100 Besuchen anhand eines hohen Perzentils wie dem 95. auswerten würden, wären nur 5 Ausreißerstichproben erforderlich, bis sich die Ausreißer auf das 95. Perzentil auswirken.

Da diese Ziele etwas im Widerspruch stehen, sind wir nach der Analyse zu dem Schluss gekommen, dass der 75. Perzentilwert ein angemessenes Gleichgewicht darstellt. Wenn Sie das 75. Perzentil verwenden, wissen wir, dass bei den meisten Besuchen der Website (3 von 4) die angestrebte Leistung oder eine bessere Leistung erreicht wurde. Außerdem ist der Wert für das 75. Perzentil weniger wahrscheinlich von Ausreißern betroffen. Zurück zu unserem Beispiel: Bei einer Website mit 100 Besuchen müssten für 25 dieser Besuche große Ausreißerproben gemeldet werden, damit der Wert beim 75. Perzentil von Ausreißern betroffen ist. 25 von 100 Stichproben sind Ausreißer möglich. Die Wahrscheinlichkeit ist jedoch viel geringer als beim 95. Perzentil.

Largest Contentful Paint

Die LCP-Grenzwerte wurden unter Berücksichtigung der folgenden Aspekte zur Nutzerfreundlichkeit und Erzielbarkeit festgelegt.

Nutzerfreundlichkeit

Eine Sekunde wird oft als die Zeit angegeben, die ein Nutzer wartet, bevor er den Fokus auf eine Aufgabe verliert. Bei einer genaueren Prüfung der relevanten Studien haben wir festgestellt, dass 1 Sekunde eine Näherung ist, um einen Bereich von Werten von etwa mehreren hundert Millisekunden bis zu mehreren Sekunden zu beschreiben.

Zwei häufig zitierte Quellen für den Grenzwert von einer Sekunde sind Card und andere und Miller. Card definiert einen Grenzwert von 1 Sekunde für eine „sofortige Antwort“ und verweist dabei auf Newells Unified Theories of Cognition. Newell erklärt unmittelbare Reaktionen als „Reaktionen, die auf einen Reiz innerhalb von ungefähr einer Sekunde erfolgen müssen (d. h. etwa von 0,3 Sekunden bis 3 Sekunden)“. Dies folgt Newells Diskussion über „Echtzeiteinschränkungen der Kognition“, in der darauf hingewiesen wird, dass „Interaktionen mit der Umgebung, die kognitive Überlegungen hervorrufen, in der Größenordnung von Sekunden stattfinden“, was etwa 0,5 bis 2 bis 3 Sekunden entspricht. Miller, eine weitere häufig zitierte Quelle für die 1-Sekunden-Grenze, stellt fest, dass „Aufgaben, die Menschen mithilfe von Maschinenkommunikation ausführen können und werden, sich erheblich ändern, wenn die Antwortverzögerung mehr als zwei Sekunden beträgt, mit einer möglichen Verlängerung um etwa eine weitere Sekunde.“

Die Untersuchungen von Miller und Card beschreiben die Zeit, die ein Nutzer wartet, bevor er den Fokus verliert, einen Bereich von etwa 0,3 bis 3 Sekunden, was darauf hindeutet, dass der LCP-Schwellenwert für „Gut“ in diesem Bereich liegen sollte. Da der bestehende Grenzwert für „gut“ bei First Contentful Paint eine Sekunde beträgt und der Largest Contentful Paint in der Regel nach dem First Contentful Paint erfolgt, beschränken wir den Bereich der LCP-Grenzwerte von 1 Sekunde auf 3 Sekunden. Um den Schwellenwert in diesem Bereich auszuwählen, der unsere Kriterien am besten erfüllt, sehen wir uns als Nächstes die Erreichbarkeit dieser Kandidaten an.

Erreichbarkeit

Anhand von CrUX-Daten können wir den Prozentsatz der Ursprünge im Web ermitteln, die unsere Grenzwerte für „gute“ LCP-Kandidaten erfüllen.

  1 Sekunde 1,5 Sekunden 2 Sekunden 2,5 Sekunden 3 Sekunden
phone 3,5 % 13 % 27 % 42 % 55 %
desktop 6,9 % 19 % 36 % 51 % 64 %
Prozentsatz der CrUX-Quellen, die gemäß den LCP-Grenzwerten für Kandidaten als „gut“ eingestuft wurden (Stand: April 2020)

Bei weniger als 10 % der Ursprünge wird der Grenzwert von 1 Sekunde erreicht. Alle anderen Grenzwerte von 1,5 bis 3 Sekunden erfüllen jedoch unsere Anforderung, dass mindestens 10 % der Ursprünge den Grenzwert „gut“ erreichen. Sie sind also weiterhin als Kandidaten zulässig.

Außerdem analysieren wir die LCP-Leistung der leistungsstärksten Websites im Web, um sicherzustellen, dass der ausgewählte Grenzwert für gut optimierte Websites regelmäßig erreicht wird. Insbesondere möchten wir einen Schwellenwert ermitteln, der bei den leistungsstärksten Websites im 75. Perzentil konstant erreicht wird. Wir haben festgestellt, dass die Grenzwerte von 1,5 und 2 Sekunden nicht immer erreicht werden, während 2,5 Sekunden immer erreicht werden.

Um einen Grenzwert für „schlecht“ für LCP zu ermitteln, verwenden wir CrUX-Daten, um einen Grenzwert zu ermitteln, der von den meisten Ursprüngen erfüllt wird:

  3 Sekunden 3,5 Sekunden 4 Sekunden 4,5 Sekunden 5 Sekunden
phone 45 % 35 % 26 % 20 % 15 %
Computer 36 % 26 % 19 % 14 % 10 %
Anteil der CrUX-Quellen, die im April 2020 für LCP-Grenzwerte als „schlecht“ eingestuft wurden

Bei einem Grenzwert von 4 Sekunden würden etwa 26 % der Zugriffe über Smartphones und 21 % der Zugriffe über Computer als schlecht eingestuft. Dieser Wert liegt in unserem Zielbereich von 10 bis 30%, sodass wir davon ausgehen, dass 4 Sekunden ein akzeptabler „schlechter“ Grenzwert sind.

Wir schließen daraus, dass 2,5 Sekunden ein angemessener Grenzwert für „gut“ und 4 Sekunden ein angemessener Grenzwert für „schlecht“ für Largest Contentful Paint sind.

Interaction to Next Paint

Die INP-Grenzwerte wurden unter Berücksichtigung der folgenden Aspekte festgelegt: Nutzerfreundlichkeit und Machbarkeit.

Nutzerfreundlichkeit

Die Forschung kommt ziemlich einheitlich zu dem Schluss, dass Verzögerungen beim visuellen Feedback von bis zu etwa 100 ms als von einer zugehörigen Quelle verursacht wahrgenommen werden, z. B. von einer Nutzereingabe. Das deutet darauf hin, dass ein idealer Grenzwert für „gut“ bei „Interaction to Next Paint“ in der Nähe dieses Werts liegen sollte.

In Jakob Nielsens häufig zitiertem Artikel Response Times: The 3 Important Limits (Antwortzeiten: Die 3 wichtigen Grenzwerte) wird 0,1 Sekunde als Grenzwert definiert, ab dem Nutzer das Gefühl haben, dass das System sofort reagiert. Nielsen zitiert Miller und Card, die Michottes The Perception of Kaausality von 1962 zitieren. In Michottes Forschung wurden den Testteilnehmern „zwei Objekte auf einem Bildschirm“ präsentiert. Objekt A startet und bewegt sich auf Objekt B zu. Sie stoppt in dem Moment, in dem sie mit B in Kontakt kommt, während B dann startet und sich von A entfernt.“ Michotte variiert das Zeitintervall zwischen dem Stoppen von Objekt A und dem Beginn der Bewegung von Objekt B. Michotte stellt fest, dass die Teilnehmer bei Verzögerungen von bis zu etwa 100 ms den Eindruck haben, dass Objekt A die Bewegung von Objekt B verursacht. Bei Verspätungen von etwa 100 ms bis 200 ms wird die Kausalität unterschiedlich wahrgenommen und bei Verzögerungen über 200 ms wird die Bewegung von Objekt B nicht mehr so wahrgenommen, als wäre sie von Objekt A verursacht worden.

Ähnlich definiert Miller einen Reaktionsgrenzwert für „Reaktion auf die Aktivierung der Steuerung“ als „die Angabe einer Aktion, die normalerweise durch die Bewegung eines Schlüssels, Schalters oder anderen Steuerelements erfolgt, das signalisiert, dass es physisch aktiviert wurde. Diese Reaktion sollte als Teil der mechanischen Aktion wahrgenommen werden, die vom Bediener ausgelöst wird. Zeitverzögerung: „Nicht mehr als 0,1 Sekunde“ und später „Die Verzögerung zwischen dem Drücken einer Taste und dem visuellen Feedback darf nicht mehr als 0,1 bis 0,2 Sekunden betragen“.

In ihrem kürzlich erschienenen Artikel Towards the Temporally Perfect Virtual Button untersuchten Kaaresoja und andere die Wahrnehmung der Gleichzeitigkeit zwischen dem Berühren einer virtuellen Schaltfläche auf einem Touchscreen und dem anschließenden visuellen Feedback, das darauf hinweist, dass die Schaltfläche berührt wurde, bei verschiedenen Verzögerungen. Bei einer Verzögerung zwischen dem Drücken der Taste und dem visuellen Feedback von 85 ms oder weniger empfanden die Teilnehmer das visuelle Feedback in 75 % der Fälle als gleichzeitig mit dem Drücken der Taste. Bei Verzögerungen von 100 ms oder weniger empfanden die Teilnehmer die Qualität des Tastenanschlags durchweg als hoch. Bei Verzögerungen von 100 ms bis 150 ms sank die wahrgenommene Qualität und erreichte bei Verzögerungen von 300 ms sehr niedrige Werte.

Daher gehen wir zu dem Schluss, dass 100 ms als „guter“ Grenzwert für die Interaktion mit der nächsten Paint-Methode für Web Vitals betrachtet wird. Da Nutzer bei Verzögerungen von 300 ms oder mehr eine niedrige Qualität gemeldet haben, sollte dies idealerweise der Grenzwert für „schlecht“ sein.

Umsetzbarkeit

Anhand der Daten aus CrUX haben wir festgestellt, dass die Mehrheit der Ursprünge im Web den Grenzwert von 200 ms für „gut“ beim INP im 75. Perzentil erreicht:

  100 ms 200 ms 300 ms 400 ms 500 ms
phone 12 % 56 % 76 % 88 % 92 %
desktop 83 % 96 % 98 % 99 % 99 %
Anteil der CrUX-Quellen, die im Mai 2022 für die Kandidatengrenzwerte für die Ladezeit als „gut“ eingestuft wurden

Besonderes Augenmerk lag auch auf der Möglichkeit, INP für Low-End-Mobilgeräte zu übergeben, die einen hohen Anteil der Websitebesuche ausmachen. Dies bestätigte die Eignung eines Grenzwerts von 200 ms.

Unter Berücksichtigung des Grenzwerts von 100 ms, der durch Studien zur Nutzerfreundlichkeit und den Kriterien für die Erzielbarkeit gestützt wird, sind wir der Meinung, dass 200 ms ein angemessener Grenzwert für eine gute Nutzerfreundlichkeit ist.

Um einen Grenzwert für „schlecht“ für LCP zu ermitteln, verwenden wir CrUX-Daten, um einen Grenzwert zu ermitteln, der von den meisten Ursprüngen erfüllt wird:

  100 ms 200 ms 300 ms 400 ms 500 ms
phone 88 % 44 % 24 % 12 % 8 %
Computer 17 % 4 % 2 % 1 % 1 %
Anteil der CrUX-Quellen, die im Mai 2022 als „schlecht“ für Kandidaten für INP-Grenzwerte eingestuft wurden

Dies deutet darauf hin, dass wir einen „schlechten“ Schwellenwert von 300 ms haben können.

Im Gegensatz zu LCP und CLS ist der INP jedoch invers mit der Beliebtheit korreliert. Je beliebter eine Website ist, desto komplexer ist sie oft, was mit höherer Wahrscheinlichkeit zu einem höheren INP führt. Wenn wir uns die 10.000 wichtigsten Websites ansehen, die den Großteil des Internetsurfens ausmachen, ergibt sich ein komplexeres Bild:

  100 ms 200 ms 300 ms 400 ms 500 ms
phone 97 % 77 % 55 % 37 % 24 %
Computer 48 % 17 % 8 % 4 % 2 %
% der CrUX-Quellen in den Top 10.000, die gemäß den Grenzwerten für potenzielle INPs im Mai 2022 als „schlecht“ eingestuft wurden

Auf Mobilgeräten würde ein Grenzwert von 300 ms für die Bewertung „schlecht“ die Mehrheit der beliebten Websites als „schlecht“ einstufen, was unsere Kriterien für die Erreichbarkeit überstrapazieren würde. 500 ms passen besser zu 10–30 % der Websites. Außerdem ist der Grenzwert von 200 ms für diese Websites strenger. Da aber 23 % der Websites diesen Wert auf Mobilgeräten erfüllen, wird das Mindestkriterium von 10 % erfüllt.

Aus diesem Grund sind 200 ms für die meisten Websites ein angemessener Grenzwert für „gut“ und mehr als 500 ms ein angemessener Grenzwert für „schlecht“.

Cumulative Layout Shift

Die CLS-Grenzwerte wurden unter Berücksichtigung der folgenden Aspekte zur Nutzerfreundlichkeit und Erzielbarkeit festgelegt.

Nutzerfreundlichkeit

Der Messwert „Cumulative Layout Shift“ (CLS) ist ein neuer Messwert, mit dem gemessen wird, wie stark sich die sichtbaren Inhalte einer Seite verschieben. Da CLS neu ist, sind uns keine Studien bekannt, die direkt die Grenzwerte für diesen Messwert beeinflussen könnten. Um einen Grenzwert zu ermitteln, der den Erwartungen der Nutzer entspricht, haben wir reale Seiten mit unterschiedlichen Layoutverschiebungen bewertet, um den maximalen Wert zu ermitteln, der als akzeptabel empfunden wird, bevor es zu erheblichen Unterbrechungen beim Lesen des Seiteninhalts kommt. In unseren internen Tests haben wir festgestellt, dass Abweichungen ab 0,15 Pixeln regelmäßig als störend wahrgenommen wurden, während Abweichungen von 0,1 Pixeln und darunter zwar wahrnehmbar, aber nicht übermäßig störend waren. Daher sind Werte bis zu 0,1 gute CLS-Grenzwerte.

Umsetzbarkeit

Basierend auf CrUX-Daten können wir sehen, dass fast 50% der Ursprünge einen CLS von 0,05 oder niedriger haben.

  0,05 0,1 0,15
phone 49 % 60 % 69 %
desktop 42 % 59 % 69 %
Prozentsatz der CrUX-Quellen, die im April 2020 für die Kandidatengrenzwerte für den CLS als „gut“ eingestuft wurden

Die CrUX-Daten deuten darauf hin, dass 0,05 ein angemessener „guter“ CLS-Schwellenwert ist.In einigen Anwendungsfällen ist es jedoch schwierig, störende Layoutverschiebungen zu vermeiden. Bei eingebetteten Inhalten von Drittanbietern, z. B. von Social-Media-Plattformen, ist die Höhe der eingebetteten Inhalte manchmal erst nach dem vollständigen Laden bekannt. Das kann zu einer Layoutverschiebung von mehr als 0,05 führen. Wir schließen daraus, dass viele Ursprünge zwar den Grenzwert von 0,05 erfüllen, der etwas weniger strenge CLS-Grenzwert von 0,1 jedoch ein besseres Gleichgewicht zwischen Qualität und Erreichbarkeit bietet. Wir hoffen, dass im Web in Zukunft Lösungen für Layoutänderungen gefunden werden, die durch Einbettungen von Drittanbietern verursacht werden. So könnte in einer zukünftigen Iteration der Core Web Vitals ein strengerer Grenzwert von 0,05 oder 0 für „gut“ verwendet werden.

Außerdem haben wir anhand von CrUX-Daten einen Grenzwert für „schlecht“ für CLS ermittelt, der von den meisten Ursprüngen erfüllt wird:

  0,15 0,2 0,25 0,3
phone 31 % 25 % 20 % 18 %
desktop 31 % 23 % 18 % 16 %
% der CrUX-Ursprünge, die bei den CLS-Grenzwerten für Kandidaten mit Stand April 2020 als „schlecht“ eingestuft wurden

Bei einem Schwellenwert von 0,25 würden etwa 20 % der Zugriffe über Smartphones und 18 % der Zugriffe über Computer als „schlecht“ eingestuft. Das liegt in unserem Zielbereich von 10–30 %. Wir haben daher entschieden, dass 0,25 ein akzeptabler Grenzwert für „schlecht“ ist.