Dlaczego dane laboratoryjne i polowe mogą się różnić (oraz co należy zrobić w związku z tym)

Dowiedz się, dlaczego narzędzia monitorujące Podstawowe wskaźniki internetowe mogą podawać różne wartości i jak interpretować te różnice.

Google udostępnia szereg narzędzi, które ułatwiają właścicielom witryn monitorowanie swoje wyniki podstawowych wskaźników internetowych. Narzędzia te zaliczają się do dwie główne kategorie:

  • narzędzi do raportowania danych laboratoryjnych, czyli danych zebranych w środowisku kontrolowanym, wstępnie zdefiniowane ustawienia urządzenia i sieci.
  • narzędzi do raportowania danych z poszczególnych pól, czyli danych zebranych od użytkowników odwiedzających Twoją witrynę; w Twojej witrynie.

Problem polega na tym, że czasami dane przekazywane przez narzędzia laboratoryjne różnią się od danych raportowanych przez narzędzia terenowe! Dane laboratoryjne mogą wskazywać, że witryna ma świetne wyniki, ale dane sugeruje, że musi i ich ulepszania. Dane pól mogą też wskazywać, że wszystkie strony są prawidłowe, dane z modułu mogą zgłaszać bardzo niski wynik.

Poniższy przykładowy raport PageSpeed Insights ze strony web.dev pokazuje, że w niektórych przypadkach dane laboratoryjne i terenowe mogą się różnić Dane dotyczące wskaźników internetowych:

Zrzut ekranu pokazujący raport PageSpeed Insights zawierający sprzeczne dane z modułów i terenów

Różnice między narzędziami są zrozumiałym źródłem nieporozumień dla programistów. W tym poście wyjaśniamy główne przyczyny, dla których mogą wystąpić te różnice. z konkretnymi przykładami dotyczącymi każdego z podstawowych wskaźników internetowych, co zrobić, gdy stwierdzisz różnice na stronach.

Dane laboratoryjne a dane terenowe

Aby zrozumieć, dlaczego narzędzia laboratoryjne i terenowe mogą podawać różne wartości, nawet w przypadku dokładnie ta sama strona internetowa — trzeba zrozumieć różnicę między modułem a polem. i skalowalnych danych.

Dane laboratoryjne

Dane modułu są określane przez wczytanie strony internetowej w kontrolowanym środowisku z wstępnie zdefiniowany zestaw warunków sieci i urządzenia. Te schorzenia to tzw. środowisko lab. Czasami nazywane jest też środowiskiem syntetycznym.

Narzędzia Chrome do raportowania danych laboratoryjnych są zwykle włączone Lighthouse.

Celem testu laboratoryjnego jest kontrolowanie jak największej liczby czynników, aby są (jak najdokładniejsze) spójne i powtarzalne od początku do końca.

Dane pól

Dane terenowe są określane przez monitorowanie wszystkich użytkowników strony i pomiar określony zestaw danych dotyczących skuteczności poszczególnych użytkowników, dla jednej osoby i aplikacji. Dane te bazują na wizytach rzeczywistych użytkowników, więc odzwierciedlają rzeczywiste urządzenia, warunki sieciowe i położenie geograficzne użytkowników.

Dane pól są też potocznie nazywane monitorowaniem rzeczywistych użytkowników (RUM); te dwa hasła są wymienne.

Narzędzia Chrome, które raportują dane z pól, zwykle pobierają je z przeglądarki Chrome Raport na temat użytkowania (CrUX). Właściciele witryn często (i zalecamy) zbierają też dane z różnych obszarów na ich podstawie, ponieważ może on zapewnić więcej przydatnych statystyk niż tylko korzystanie z raportu na temat użytkowania Chrome.

Najważniejsze jest to, że w przypadku danych terenowych nie chodzi tylko o to, jest rozkładem liczb. Oznacza to, że w przypadku niektórych osób odwiedzających może ładować się bardzo szybko, natomiast innym może ładować się bardzo wolno. Dane pól dotyczące witryny to pełny zestaw wszystkich danych o skuteczności zbierane od użytkowników.

Na przykład raporty raportu na temat użytkowania Chrome pokazują rozkład danych dotyczących skuteczności z rzeczywistych, użytkowników Chrome w ciągu ostatnich 28 dni. Za pomocą niemal każdego raportu widać, że niektórzy użytkownicy odwiedzający witrynę mogą być z niej bardzo zadowoleni inne osoby mogą mieć bardzo złe wrażenia.

Jeśli narzędzie raportuje tylko jedną liczbę dla danego rodzaju danych, reprezentują określony punkt rozkładu. Narzędzia raportujące Core Web Wynika to z 75. percentyl.

Jak widać na LCP w danych pól na zrzucie ekranu powyżej, rozkład, gdzie:

  • W przypadku 88% wizyt wskaźnik LCP wynoszący 2,5 sekundy lub niższy (dobry).
  • W przypadku 8% wizyt wskaźnik LCP mieścił się w zakresie od 2,5 do 4 sekund (wymagana poprawa).
  • W przypadku 4% wizyt wskaźnik LCP przekraczający 4 sekundy (niski).

W przypadku 75 centyla wartość LCP wynosiła 1, 8 sekundy:

Rozkład wyników LCP w polu

Dane modułu z tej samej strony mają wartość LCP równą 3,0 sekundy. Choć ta wartość jest większy niż 1,8 sekundy widoczny w danych terenowych, jest to nadal prawidłowy LCP jest to jedna z wielu wartości, które składają się środowiska wczytywania.

Wynik LCP w module

Dlaczego dane laboratoryjne różnią się od danych terenowych

Jak wyjaśniamy w sekcji powyżej, dane laboratoryjne i dane terenowe naprawdę mierzą bardzo różne rzeczy.

Dane terenowe obejmują wiele różnych warunków sieci i urządzeń, a także mamy do czynienia z mnóstwem różnych rodzajów zachowań użytkowników. Uwzględnia też wszystkie inne czynniki wpływające na wygodę użytkowników, np. przez optymalizację przeglądarki, pamięć podręczna stanu strony internetowej (bfcache) lub optymalizacje platformy takie jak Pamięć podręczna AMP.

Dane laboratoryjne celowo ograniczają liczbę potrzebnych zmiennych. O test laboratoryjny składa się z tych elementów:

  • Jedno urządzenie...
  • połączono z jedną siecią...
  • w jednej lokalizacji geograficznej.

Szczegóły danego testu laboratoryjnego mogą, ale nie muszą, 75 centyl danych pól dla danej strony lub witryny.

Kontrolowane środowisko modułu jest przydatne podczas debugowania problemów lub testowania funkcji przed wdrożeniem w środowisku produkcyjnym, ale jeśli określisz te czynniki wyraźnie nie odzwierciedlasz wariancji, którą widzisz w świecie rzeczywistym we wszystkich rodzajach sieci, możliwościach urządzeń i lokalizacjach geograficznych. Ty nie rejestrują też wpływu rzeczywistych zachowań użytkowników na skuteczność. takie jak przewijanie, zaznaczanie tekstu lub klikanie elementów na stronie.

Oprócz możliwej rozbieżności między warunkami laboratoryjnymi a warunkami dla większości rzeczywistych użytkowników, występują też pewne subtelne różnice które warto zrozumieć, aby jak najlepiej wykorzystać możliwości modułu. i danych pól, a także wszelkich różnic.

W kilku kolejnych sekcjach znajdziesz szczegółowe informacje o najczęstszych przyczynach mogą się różnić między danymi laboratoryjnymi a danymi terenowymi dotyczącymi każdego Dane Vitals:

LCP

Różne elementy LCP

Element LCP zidentyfikowany w teście laboratoryjnym nie może być taki sam jak LCP który użytkownicy widzą na Twojej stronie.

Jeśli wygenerujesz raport w Lighthouse dla danej strony, zwróci on LCP za każdym razem. Ale jeśli spojrzymy na dane pól dla tej samej strony, można zwykle zauważyć różne elementy LCP, które zależą od okoliczności związanych z każdą wizytą na stronie.

Na przykład te czynniki mogą mieć wpływ na zmianę wskaźnika LCP: element określany dla tej samej strony:

  • Różne rozmiary ekranów urządzeń powodują wyświetlanie różnych elementów. w widocznym obszarze.
  • Jeśli użytkownik jest zalogowany lub jeśli w niektórych element LCP może się bardzo różnić w zależności od użytkownika.
  • Podobnie jak w przypadku poprzedniego punktu, jeżeli na stronie działa test A/B, może co spowoduje wyświetlenie bardzo różnych elementów.
  • Zestaw czcionek zainstalowanych w systemie użytkownika może wpływać na rozmiar tekstu strony (a tym samym który element jest elementem LCP).
  • Testy laboratoryjne są zwykle przeprowadzane na „podstawie” strony Adres URL – bez parametrów zapytania lub fragmentów z krzyżykiem. W rzeczywistości użytkownicy często udostępniają adresy URL zawierający identyfikator fragmentu lub fragmentem tekstu, tak więc element LCP może znajduje się ze środka lub dołu strony (a nie „nad część strony).

LCP w tym polu jest obliczany jako 75 centyl wszystkich wizyt użytkowników. na stronę, jeśli duży odsetek z nich miał wczytywany element LCP. bardzo szybko, na przykład akapit tekstu renderowany z użyciem czcionki systemowej, a następnie nawet jeśli niektórzy z tych użytkowników mieli jako LCP duży, wolno ładujący się obraz. elementu, może nie mieć wpływu na wynik tej strony, jeśli zbiega się on poniżej 25%. użytkowników.

Może też być inaczej. Test laboratoryjny może wykryć blok jako elementu LCP, ponieważ imituje on telefon Moto G4 z stosunkowo mały widoczny obszar, a główny obraz strony jest początkowo renderowany. Dane z terenu mogą jednak obejmować głównie użytkowników telefonów Pixel XL oraz na większych ekranach, więc powolny baner powitalny to dla nich element LCP.

Wpływ stanu pamięci podręcznej na LCP

Testy laboratoryjne zwykle wczytują stronę z „zimną” pamięcią podręczną, ale gdy odwiedzają ją prawdziwi użytkownicy stronę, której zasoby mogą już być przechowywane w pamięci podręcznej.

Przy pierwszym wczytaniu strony przez użytkownika strona może wczytywać się wolno, ale jeśli nieprawidłowo skonfigurowano buforowanie, gdy następnym razem użytkownik zwróci może załadować się od razu.

Chociaż niektóre narzędzia laboratoryjne obsługują wiele uruchomień tej samej strony (aby symulować powracających użytkowników), narzędzie laboratorium nie może stwierdzić, jaki odsetek rzeczywistych wizyt w witrynie pochodzi od nowych, a jakie od powracających użytkowników.

Witryny o dobrze zoptymalizowanych konfiguracjach pamięci podręcznej i dużej liczbie powracających użytkowników mogą odkryć, że rzeczywiste LCP są znacznie szybsze, niż sugerują dane laboratoryjne.

Optymalizacje w technologii AMP i technologii Signed Exchange

witryny utworzone w technologii AMP lub korzystające z Signed Exchange. (SXG) mogą być wstępnie wczytywane przez agregatory treści, takie jak Google. Wyszukaj. Może to znacznie zwiększyć wydajność wczytywania strony przez użytkowników. odwiedzający Twoje strony na tych platformach.

Oprócz wstępnego wczytywania treści z innych domen witryny wstępnie wczytywać treści na kolejnych stronach w witrynie, co może poprawić LCP także tych stron.

Narzędzia laboratoryjne nie symulują korzyści wynikających z tych optymalizacji, a nawet ale nie wiedzieli, jaki procent ruchu takimi jak wyszukiwarka Google, w porównaniu z innymi źródłami.

Wpływ pamięci podręcznej stanu strony internetowej na LCP

Po przywróceniu stron z pamięci podręcznej stanu strony proces wczytywania jest bliski jest natychmiastowa, a te funkcje są uwzględnione w Twojej dziedzinie danych.

Testy laboratoryjne nie uwzględniają bfcache, więc jeśli Twoje strony bfcache-friendly, prawdopodobnie poprawiają wyniki LCP.

Wpływ interakcji użytkownika na LCP

LCP określa czas renderowania największego obrazu lub bloku tekstowego w widoczny obszar, ale ten największy element może się zmienić podczas wczytywania strony lub jest dynamicznie dodawana do widocznego obszaru.

W module przeglądarka czeka, aż strona zostanie w pełni załadowana, który określa element LCP. W terenie przeglądarka zatrzymuje się monitorowania pod kątem większych elementów gdy użytkownik przewinie stronę lub wejdzie z nią w interakcję.

Ma to sens (i jest konieczne), ponieważ użytkownicy zwykle będą czekać wejść w interakcję ze stroną, dopóki się nie „wyświetli” czyli właśnie tyle, ile wskazuje LCP. który ma być wykrywany. Nie ma sensu uwzględniać elementów dodanych do widoczny po interakcji użytkownika, ponieważ elementy te mogły zostać wczytanych dzięki działaniu użytkownika.

Konsekwencją jest jednak to, że dane pól dotyczące strony mogą być raportowane szybciej. czas LCP w zależności od tego, jak użytkownicy zachowują się na danej stronie.

INP

INP wymaga interakcji rzeczywistego użytkownika

Dane INP określają responsywność strony w odniesieniu do interakcji użytkowników, w chwili, gdy użytkownicy wchodzą z nią w interakcję.

Druga część tego zdania jest kluczowa, ponieważ testy laboratoryjne, nawet te, Zachowanie użytkowników skryptu pomocy technicznej, nie można dokładnie przewidzieć, kiedy wybiorą wchodzić w interakcję ze stroną, więc nie jest w stanie dokładnie zmierzyć FID.

TBT nie bierze pod uwagę zachowań użytkowników

Całkowity czas blokowania (TBT) ułatwia diagnozowanie problemów z INP, ponieważ pokazuje, jak bardzo wątek główny jest blokowany podczas wczytywania strony.

Chodzi o to, że strony z dużą ilością synchronicznego JavaScriptu lub innymi zasobami jest bardziej prawdopodobne, że zadania renderowania będą miały zablokowany wątek główny, pierwszej interakcji. Jeśli jednak użytkownicy będą czekać na interakcję ze stroną do gdy JavaScript zakończy wykonywanie kodu, wartość INP może być bardzo niska.

To, kiedy użytkownicy decydują się na interakcję ze stroną, zależy w dużej mierze od tego, czy wygląda na interaktywny i nie można go zmierzyć za pomocą TBT.

TBT nie uwzględnia opóźnienia kliknięcia

Jeśli witryna nie jest zoptymalizowana do wyświetlania na urządzeniach mobilnych, przeglądarki dodadzą 300 ms opóźnienie po kliknięciu przed uruchomieniem modułów obsługi zdarzeń. Robią to, bo muszą sprawdzanie, czy użytkownik próbuje powiększyć dwukrotnym dotknięciem, zanim będzie mógł się uruchomić; zdarzeń myszy lub kliknięć.

To opóźnienie jest wliczane do wartości INP strony, ponieważ ma wpływ na rzeczywiste dane wejściowe związane z opóźnieniem. Ponieważ jednak z technicznego punktu widzenia opóźnienie to nie jest długie , nie ma wpływu na TBT strony. Oznacza to, że strona może mieć niski współczynnik INP, mimo że ma bardzo dobre wyniki w rozszerzeniu TBT.

Wpływ stanu pamięci podręcznej i pamięci podręcznej bfcache na INP

Tak samo jak prawidłowe buforowanie poprawiające LCP w polu, może również i zwiększanie wartości INP.

W rzeczywistości użytkownik może mieć kod JavaScript do witryny już dlatego przetwarzanie danych może potrwać mniej i zmniejszyć opóźnienia.

To samo dotyczy stron przywróconych z pamięci podręcznej stanu strony internetowej. W takich przypadkach JavaScript jest przywracany z pamięci, więc przetwarzanie może być bardzo ograniczone lub wcale .

CLS

Wpływ interakcji użytkownika na CLS

CLS zmierzony w module uwzględnia tylko przesunięcia układu, które występują powyżej zarówno w części strony widocznej na ekranie, jak i w trakcie wczytywania. Jest to jednak tylko część miarodajne.

CLS uwzględnia w tym polu wszystkie nieoczekiwany układ i przesunięciach, które zachodzą w całym czas życia strony, w tym treści, które przesuwają się, gdy użytkownik przewija stronę lub reakcja na powolne żądania sieciowe po interakcji użytkownika.

Na przykład strony dość często ładują leniwe ładowanie obrazów lub elementów iframe bez wymiarów i może powodować zmienia się, gdy użytkownik przewija stronę do tych sekcji. Jednak te zmiany mogą ma miejsce tylko wtedy, gdy użytkownik przewinie stronę w dół, co często nie jest objęte testem laboratoryjnym.

Spersonalizowana treść

Spersonalizowane treści – w tym reklamy kierowane i testy A/B – wpływają na to, które elementy są wczytywane na stronie. Ma to też wpływ na sposób wczytywania, bo reklamy są personalizowane treści są często wczytywane później i umieszczane w głównej treści strony, co powoduje przesunięciach układu.

W module strona jest zazwyczaj wczytywana bez spersonalizowanych treści lub zawierające treści dla ogólnego „użytkownika testowego”, które może, ale nie musi, powodować zmiany co faktycznie widzą prawdziwi użytkownicy.

Dane terenowe obejmują wrażenia wszystkich użytkowników, więc ilość (i stopień) przesunięć układu na danej stronie zależy w dużym stopniu od jej zawartości został wczytany.

Wpływ stanu pamięci podręcznej i pamięci podręcznej bfcache na CLS

Dwie najczęstsze przyczyny przesunięć układu podczas wczytywania to obrazy i Elementy iframe bez wymiarów (jak wspomniano powyżej) i powolne wczytywanie się stron internetowych czcionki. Oba te problemy wpływa na wrażenia przy pierwszej wizycie użytkownika w witrynie, jeśli pamięć podręczna jest puste.

Jeśli zasoby strony są przechowywane w pamięci podręcznej lub jeśli sama strona jest przywracana z bfcache, przeglądarka zazwyczaj może renderować obrazy i czcionki od razu, bez i czeka na ich pobranie. Może to spowodować obniżenie wartości CLS w polu. niż może to wykazać narzędzie laboratoryjne.

Co zrobić, gdy wyniki są różne

Ogólnie rzecz biorąc, jeśli w przypadku danej strony masz zarówno dane z terenu, jak i dane laboratoryjne, danych terenowych należy wykorzystać do ustalania priorytetów działań. Dane z pola jest najdokładniejszym sposobem na określenie, czego potrzebują musisz naprawdę zrozumieć, z czym mają problemy i z czym muszą na ulepszanie AI.

Z drugiej strony, jeśli dane z pola wskazują ogólne wyniki, ale wskazuje na to, że wiele można jeszcze poprawić. co można jeszcze ulepszyć.

Mimo że dane terenowe odzwierciedlają rzeczywiste wrażenia użytkowników, jedynie w przypadku użytkowników, którzy mogą w niej załadować. Dane laboratoryjne czasami pomagają zidentyfikować możliwości zwiększenia zasięgu witryny i sprawić, czy jest bardziej dostępna dla użytkowników korzystających z wolniejszych sieci lub urządzeń niższej klasy.

Zarówno dane laboratoryjne, jak i dane terenowe są ważnymi pomiar skuteczności. Oba mają swoje mocne i ograniczenia. Jeśli używasz tylko jednej z nich, być może przegapisz szansę na ulepszenie z myślą o użytkownikach.

Więcej informacji