Önemli Web Verileri metrik eşiklerini tanımlama

Core Web Vitals eşiklerinin arkasındaki araştırma ve metodoloji

Bryan McQuade
Bryan McQuade

Önemli Web Verileri, web'de gerçek dünya kullanıcı deneyiminin önemli yönlerini ölçen bir dizi alan metriğidir. Önemli Web Verileri, geliştiricilerin sitelerinin sunduğu deneyimin "iyi", "iyileştirme gerekli" veya "kötü" olup olmadığını nitel olarak anlamalarına yardımcı olan, metrikleri ve her metrik için hedef eşikleri içerir. Bu gönderide, genel olarak Önemli Web Verileri metriklerinin eşiklerini seçmek için kullanılan yaklaşımın yanı sıra her bir Önemli Web Verileri metriğinin eşiklerinin nasıl seçildiği açıklanmaktadır.

Bilgi tazeleme: Önemli Web Verileri metrikleri ve eşikleri

2020'de Önemli Web Verileri üç metrikten oluşmaktadır: Largest Contentful Paint (LCP), First Input Delay (FID) ve Cumulative Layout Shift (CLS). Her metrik, kullanıcı deneyiminin farklı bir yönünü ölçer: LCP algılanan yükleme hızını ölçer ve sayfa yükleme zaman çizelgesinde sayfanın ana içeriğinin yüklenebileceği noktayı işaretler; FID yanıt verme düzeyini ölçer ve kullanıcıların sayfayla ilk kez etkileşim kurmaya çalışırken hissettiği deneyimi ölçer; CLS ise görsel kararlılığı ve görünür sayfa içeriğinin beklenmeyen düzen kayması miktarını ölçer.

Her Önemli Web Verileri metriğinin, performansı "iyi", "iyileştirme gerekli" veya "kötü" olarak sınıflandıran ilişkili eşikleri vardır:

Largest Contentful Paint eşiği önerileri First Input Delay eşik önerileri Cumulative Layout Shift eşik önerileri
  İyi Yetersiz Yüzdelik olarak
Largest Contentful Paint ≤2.500 ms >4.000 ms. 75
İlk Giriş Gecikmesi ≤100ms >300 ms. 75
Cumulative Layout Shift ≤0,1 >0,25 75

Buna ek olarak, bir sayfanın veya sitenin genel performansını sınıflandırmak için o sayfa ya da sitenin aldığı tüm sayfa görüntülemelerinin 75. yüzdelik dilimi değerini kullanırız. Başka bir deyişle, bir sitedeki sayfa görüntülemelerinin en az yüzde 75'i "iyi" eşiğini karşılıyorsa, site bu metrik için "iyi" performansa sahip olarak sınıflandırılır. Öte yandan, sayfa görüntülemelerinin en az yüzde 25'i "yetersiz" eşiği karşılıyorsa site "düşük" performansa sahip olarak sınıflandırılır. Örneğin, 2 saniyelik 75. yüzdelik dilim LCP "iyi", 5 saniyelik 75. yüzdelik dilim LCP ise "yetersiz" olarak sınıflandırılır.

Önemli Web Verileri metrik eşikleri için ölçütler

Önemli Web Verileri metrikleri için eşikler oluştururken önce her bir eşiğin karşılaması gereken ölçütleri belirledik. Aşağıda, 2020 Core Web Vitals metrik eşiklerini değerlendirirken Google'da kullandığımız kriterleri açıklıyorum. Sonraki bölümlerde, 2020'de her bir metrik için eşiklerin seçiminde bu ölçütlerin nasıl uygulandığı daha ayrıntılı şekilde ele alınacaktır. Önümüzdeki yıllarda, web'deki harika kullanıcı deneyimlerini ölçme becerimizi daha da iyileştirmek için ölçütlerde ve eşiklerde iyileştirmeler ve eklemeler yapmayı planlıyoruz.

Yüksek kaliteli kullanıcı deneyimi

Birincil hedefimiz, kullanıcıya ve sunduğu deneyim kalitesine göre optimizasyon yapmaktır. Bunu göz önünde bulundurarak, Önemli Web Verileri "iyi" eşiklerini karşılayan sayfaların yüksek kaliteli kullanıcı deneyimi sunmasını sağlamayı amaçlıyoruz.

Kaliteli kullanıcı deneyimiyle ilişkili bir eşiği belirlemek için insan algısına ve HCI araştırmasına bakarız. Bu araştırma bazen tek bir sabit eşik kullanılarak özetlense de, temel araştırmanın genellikle bir dizi değer olarak ifade edildiğini görüyoruz. Örneğin, kullanıcıların genellikle odaklanmadan önce beklediği süre ile ilgili araştırmalar bazen 1 saniye olarak tanımlanırken temel araştırma, aslında yüzlerce milisaniye ile birden çok saniye arasında bir aralık olarak ifade edilir. Algı eşiklerinin kullanıcıya göre değişmesi ve bağlamın, toplu ve anonimleştirilmiş Chrome metrikleri verileri tarafından daha da desteklenmektedir. Bu veriler, kullanıcıların sayfa yüklemesini iptal etmeden önce bir web sayfasının içerik görüntülemesi için çok fazla süre beklemediğini göstermektedir. Aksine, bu veriler düzgün ve sürekli bir dağılım gösterir. İnsan algı eşiklerini ve ilgili HCI araştırmalarını daha ayrıntılı bir şekilde incelemek için Web Verilerinin Arkasındaki Science sayfasına bakın.

Belirli bir metrikle ilgili kullanıcı deneyimi araştırmasının mevcut olduğu ve literatürdeki değer aralığı konusunda makul bir fikir birliğinin olduğu durumlarda bu aralığı, eşik seçme sürecimize yön vermesi için bir giriş olarak kullanırız. Cumulative Layout Shift gibi yeni bir metrik gibi alakalı kullanıcı deneyimi araştırmasının kullanılamadığı durumlarda, iyi kullanıcı deneyimiyle sonuçlanan bir eşik belirlemek için bunun yerine bir metrik için farklı aday eşiklerini karşılayan gerçek dünyadaki sayfaları değerlendiririz.

Mevcut web içeriğiyle ulaşılabilir

Ayrıca, site sahiplerinin sitelerini "iyi" eşikleri karşılayacak şekilde optimize edebilmelerini sağlamak için bu eşiklerin web'deki mevcut içerik için ulaşılabilir olmasını şart koşuyoruz. Örneğin, sıfır milisaniye ideal bir LCP "iyi" eşiğidir ve bu şekilde anında yükleme deneyimleri sağlar. Ancak ağ ve cihaz işleme gecikmeleri nedeniyle çoğu durumda sıfır milisaniyelik bir eşik elde edilemez. Bu nedenle sıfır milisaniye, Önemli Web Verileri için LCP "iyi" eşiği değildir.

Aday Önemli Web Verileri "iyi" eşiklerini değerlendirirken Chrome Kullanıcı Deneyimi Raporu'ndaki (CrUX) verilere dayanarak bu eşiklerin ulaşılabileceğini doğrularız. Bir eşiğin ulaşılabilir olduğunu onaylamak için kaynakların en az %10'unun şu anda "iyi" eşiğini karşılaması gerekir. Buna ek olarak, iyi optimize edilmiş sitelerin, alan verilerindeki değişkenlik nedeniyle yanlış sınıflandırılmadığından emin olmak için, iyi optimize edilmiş içeriğin sürekli olarak "iyi" eşiğini karşıladığını doğrularız.

Öte yandan, "yetersiz" eşiği, şu anda yalnızca az sayıda kaynağın karşılayamadığı bir performans düzeyini belirleyerek belirleriz. "Düşük" bir eşik tanımlamayla ilgili araştırma bulunmadığı sürece, varsayılan olarak en kötü performans gösteren% 10-30 kaynak "yetersiz" olarak sınıflandırılır.

Ölçütlerle ilgili son düşünceler

Aday eşiklerini değerlendirirken ölçütlerin zaman zaman birbiriyle çeliştiğini gördük. Örneğin, bir eşiğin istikrarlı bir şekilde ulaşılabilmesi ile istikrarlı bir şekilde iyi kullanıcı deneyimi sağlanması arasında bir gerilim olabilir. Ayrıca, insan algısı araştırmalarının genellikle bir dizi değer sağladığı ve kullanıcı davranışı metriklerinin davranışlarda kademeli değişiklikler gösterdiği göz önünde bulundurulduğunda, bir metrik için genellikle tek bir "doğru" eşiği olmadığını gördük. Bu nedenle, 2020 Core Web Vitals için yaklaşımımız, yukarıdaki kriterleri en iyi karşılayan eşikleri seçmektir. Bununla birlikte, tek bir mükemmel eşik olmadığını ve bazen birden fazla makul aday eşiği arasından seçim yapmamız gerekebileceğini de dikkate alırız. "Mükemmel eşik nedir?" diye sormak yerine, "kriterlerimize en iyi hangi aday eşiğinin" ulaştığını sormaya odaklandık.

Yüzdelik dilim seçimi

Daha önce belirtildiği gibi, bir sayfanın veya sitenin genel performansını sınıflandırmak için o sayfa veya siteye yapılan tüm ziyaretlerin 75. yüzdelik dilimi kullanılır. 75. yüzdelik dilim iki ölçüte göre seçildi. İlk olarak, yüzdelik dilim, bir sayfaya veya siteye yapılan ziyaretlerin büyük bir bölümünün hedef performans düzeyini karşılamasını sağlamalıdır. İkinci olarak, seçilen yüzdelik değer, aykırı değerlerden çok fazla etkilenmemelidir.

Bu hedefler birbiriyle biraz çelişkilidir. İlk hedefe ulaşmak için daha yüksek bir yüzdelik dilim genellikle daha iyi bir seçimdir. Ancak daha yüksek yüzdelik dilimlerle sonuçta elde edilen değerin, aykırı değerlerden etkilenme olasılığı da artar. Bir siteye yapılan birkaç ziyaretin, aşırı büyük LCP örneklerine neden olan kesintili ağ bağlantılarında olması durumunda, site sınıflandırmamızın bu aykırı değer örneklerine göre belirlenmesini istemeyiz. Örneğin, 100 ziyaret almış bir sitenin performansını 95 gibi yüksek bir yüzdelik dilim kullanarak değerlendiriyorsak, aykırı değerlerden etkilenecek 95. yüzdelik değer için yalnızca 5 aykırı değer örneği alınır.

Bu hedeflerin biraz çelişki olduğu düşünülürse analizin sonucunda, yüzde 75'lik oranın makul bir denge sağladığı sonucuna vardık. 75. yüzdelik dilimi kullanarak, siteye yapılan ziyaretlerin çoğunda (3/4) hedef performans düzeyinin veya daha iyi bir performansın yaşandığını biliyoruz. Ayrıca, 75. yüzdelik dilim değerinin aykırı değerlerden etkilenme olasılığı daha düşüktür. Örneğimize dönersek, 100 ziyaret almış bir site için bu ziyaretlerden 25'inin, aykırı değerlerden etkilenmesi için 75. yüzdelik dilimdeki değer için büyük aykırı örneklerin raporlanması gerekir. 100 örnekten 25'inin aykırı olması mümkündür, ancak bu olasılık, 95. yüzdelik duruma kıyasla çok daha düşüktür.

Largest Contentful Paint

Deneyim kalitesi

1 saniye genellikle kullanıcının bir göreve odaklanmasını kaybetmeye başlamadan önce bekleyeceği süre olarak belirtilir. İlgili araştırmayı daha yakından incelediğimizde, 1 saniyenin, yaklaşık birkaç yüz milisaniye ile birkaç saniye arasında bir değer aralığını tanımlayan yaklaşık bir değer olduğunu tespit ettik.

1 saniyelik eşik için en sık belirtilen iki kaynak Cardet al ve Miller'dır. Kart, Newell'in Birleşik Biliş Teorileri'nden alıntı yaparak 1 saniyelik bir "hemen yanıt" eşiği tanımlar. Newell, acil yanıtları "yaklaşık bir saniye içinde (yaklaşık ~ 0,3 saniye ile ~3 saniye arasında) bazı uyarıcılara verilmesi gereken yanıtlar" olarak açıklıyor. Bu, Newell'in "bilişteki gerçek zamanlı kısıtlamalar" hakkındaki tartışmasını takip eder. Burada, "bilişsel düşünceleri harekete geçiren çevreyle etkileşimlerin saniyeler sırasına göre gerçekleştiğine" dikkat çekeriz. Bu süre yaklaşık 0,5 ila 2-3 saniyedir. 1 saniyelik eşik için yaygın olarak belirtilen bir diğer kaynak olan Miller, "insanların makine iletişimleriyle gerçekleştirebileceği ve gerçekleştireceği görevler, iki saniyeden uzun süren yanıt gecikmelerinin de karakterini ciddi şekilde değiştireceğini ve olası bir saniyeyi veya daha uzun olabileceğini" belirtiyor.

Miller ve Card'ın araştırması, kullanıcının odağını kaybetmeden önce bekleyeceği süreyi yaklaşık 0, 3 ile 3 saniye arasında bir aralık olarak açıklar.Bu da LCP "iyi" eşiğimizin bu aralıkta olması gerektiğini gösterir. Buna ek olarak, mevcut First Contentful Paint "iyi" eşiğinin 1 saniye olduğu ve Largest Contentful Paint'in genellikle First Contentful Paint'ten sonra gerçekleştiği düşünülürse 1 saniyeden 3 saniyeye kadar olan aday LCP eşiklerimizi daha da kısıtlarız. Bu aralıkta, ölçütlerimizi en iyi karşılayan eşiği seçmek için aşağıda bu aday eşiklerinin ulaşılabilirliğine bakarız.

Ulaşılabilirlik

CrUX'ten elde edilen verileri kullanarak, web'de aday LCP "iyi" eşiklerimizi karşılayan kaynakların yüzdesini belirleyebiliriz.

"İyi" olarak sınıflandırılan CrUX kaynaklarının yüzdesi (aday LCP eşikleri için)

  1 saniye 1,5 saniye 2 saniye 2,5 saniye 3 saniye
phone %3,5 %13 %27 %42 %55
masaüstü %6,9 %19 %36 %51 %64

Kaynakların% 10'undan azı 1 saniyelik eşiği karşılarken 1, 5 ila 3 saniye arasındaki diğer tüm eşikler, kaynakların en az% 10'unun "iyi" eşiği karşılaması ve bu nedenle hâlâ geçerli adaylar olması şartımızı karşılar.

Buna ek olarak, iyi optimize edilmiş sitelerde seçilen eşiğe tutarlı bir şekilde ulaşılabildiğinden emin olmak amacıyla, web'de en iyi performans gösteren sitelerin LCP performansını analiz ederek bu siteler için hangi eşiklerin tutarlı bir şekilde ulaşılabileceğini belirleriz. Özellikle, en iyi performansı gösteren siteler için 75. yüzdelik dilimde sürekli olarak ulaşılabilen bir eşik belirlemeyi amaçlıyoruz. Her zaman 1,5 ve 2 saniyelik eşiklere ulaşılırken 2,5 saniyeye ulaşılamayacağını tespit ettik.

LCP için "yetersiz" bir eşiği tanımlamak amacıyla, çoğu kaynağın ulaştığı bir eşiği tanımlamak için CrUX verilerini kullanırız:

"Kötü" olarak sınıflandırılan CrUX kaynaklarının yüzdesi (aday LCP eşikleri için)

  3 saniye 3,5 saniye 4 saniye 4,5 saniye 5 saniye
phone %45 %35 %26 %20 %15
masaüstü %36 %26 %19 %14 %10

4 saniyelik eşik için telefon kaynaklarının yaklaşık% 26'sı ve masaüstü başlangıç noktalarının% 21'i kötü olarak sınıflandırılır. Bu oran, hedef aralığımız olan %10-30'dur. Bu nedenle, 4 saniyenin kabul edilebilir "düşük" bir eşik olduğu sonucuna varırız.

Bu nedenle, 2, 5 saniyenin makul bir "iyi" eşik ve 4 saniyenin Largest Contentful Paint için makul bir "kötü" eşik olduğu sonucuna varırız.

İlk Giriş Gecikmesi

Deneyim kalitesi

Araştırmalar, yaklaşık 100 ms'ye kadar olan görsel geri bildirimdeki gecikmelerin, kullanıcı girişi gibi ilişkili bir kaynaktan kaynaklandığı sonucuna varma konusunda makul ölçüde tutarlıdır. Bu durum, 100 ms'lik İlk Giriş Gecikmesi "iyi" eşiğinin minimum çubuk olarak uygun olabileceği anlamına gelir: Giriş işleme gecikmesi 100 ms'yi aşarsa diğer işleme ve oluşturma adımlarının zamanında tamamlanma şansı olmaz.

Jakob Nielsen'in yaygın olarak bahsettiği Yanıt Süreleri: 3 Önemli Sınır'da, kullanıcının sistemin anında tepki verdiğini hissetmesi için sınır 0,1 saniye olarak tanımlanır. Nielsen, Michotte'in 1962 tarihli The Perception of Causality adlı kitabından alıntı yapan Miller ve Card'dan alıntı yapmaktadır. Michotte'in araştırmasında, deney katılımcılarına ekranda iki nesne gösteriliyor. A nesnesi hareket eder ve B'ye doğru hareket eder. B ile temas ettiği anda durur, ikincisi ise başlayıp A'dan uzaklaşır." Michotte, A Nesnesinin durması ile B Nesnesinin hareket etmeye başlaması arasındaki zaman aralığını değiştirir. Michotte, yaklaşık 100 ms'ye kadar olan gecikmelerde, katılımcıların A nesnesinin B nesnesinin hareketine neden olduğu izlenimine sahip olduğunu tespit eder. Yaklaşık 100 ms ile 200 ms arasındaki gecikmeler için nedensellik algısı karışıktır ve 200 ms. üzerindeki gecikmeler için B Nesnesinin hareketi artık A Nesnesinden kaynaklanmış gibi görülmez.

Benzer şekilde Miller, "Etkinleştirmeyi kontrol etme yanıtı" için bir yanıt eşiğini "genellikle bir tuşun, anahtarın veya başka bir kontrol üyesinin hareket ettirerek fiziksel olarak etkinleştirildiğine işaret eden işlemin göstergesi" olarak tanımlar. Bu yanıt, operatör tarafından tetiklenen mekanik işlemin bir parçası olarak algılanmalıdır. Süre gecikmesi: 0,1 saniyeden uzun olamaz" veya "bir tuşa basılması ile görsel geri bildirim arasındaki gecikme 0,1 ila 0,2 saniye olmalıdır".

Daha yakın bir zamanda, Temporally Perfect Virtual Button'da Kaaresoja ve diğerleri, dokunmatik ekranda sanal bir düğmeye dokunma ile düğmeye dokunulduğunu gösteren daha sonra görsel geri bildirim arasındaki eş zamanlılık algısını araştırdı ve bunun için çeşitli gecikmeleri belirledi. Düğmeye basma ve görsel geri bildirim arasındaki gecikme 85 ms veya daha kısa olduğunda, katılımcılar görsel geri bildirimin düğmeye basılma sürelerinin% 75'inde aynı anda göründüğünü bildirmiştir. Ayrıca, 100 ms veya daha kısa gecikmeler için, katılımcılar sürekli olarak yüksek algılanan düğme basım kalitesinin 100 ms ile 150 ms arasındaki gecikmelerden düştüğü, 300 ms'lik gecikmeler için ise çok düşük seviyelere ulaşıldığını bildirmiştir.

Yukarıdaki bilgiler ışığında, araştırmanın Web Verileri için uygun bir İlk Giriş Gecikmesi eşiği olarak 100 ms civarında bir değere işaret ettiği sonucuna vardık. Ayrıca, kullanıcıların 300 ms veya daha uzun gecikmeler için düşük kalite seviyelerinde bildirdiği göz önünde bulundurulduğunda, 300 ms makul bir "düşük" eşik olarak kabul edilir.

Ulaşılabilirlik

CrUX'ten alınan verileri kullanarak, web'deki kaynakların çoğunun 75. yüzdelik dilimde 100 ms. FID "iyi" eşiğini karşıladığını belirleriz:

FID 100 ms eşiği için "iyi" olarak sınıflandırılan CrUX kaynaklarının yüzdesi

100 ms
phone %78
masaüstü >%99

Buna ek olarak, web genelindeki en iyi sitelerin 75. yüzdelik dilimde tutarlı bir şekilde bu eşiğe ulaşabildiğini (ve genellikle 95. yüzdelik dilimde karşılayabildiğini) gözlemleriz.

Yukarıdaki bilgilere dayanarak 100 ms'nin, FID için makul bir "iyi" eşik olduğu sonucuna varırız.

Cumulative Layout Shift

Deneyim kalitesi

Cumulative Layout Shift (CLS), bir sayfanın görünür içeriğinin ne kadar yer değiştirdiğini ölçen yeni bir metriktir. CLS'nin yeni bir özellik olduğu için bu metriğin eşiklerini doğrudan bilgilendirebilecek bir araştırmaya sahip değiliz. Bu nedenle, kullanıcı beklentileriyle uyumlu bir eşiği belirlemek amacıyla, sayfa içeriği tüketilirken önemli kesintilere neden olmadan önce kabul edilebilir olarak algılanan maksimum değişiklik miktarını belirlemek için farklı miktarlarda düzen değişikliğine sahip gerçek dünyadaki sayfaları değerlendirdik. Dahili testlerimizde, 0,15 ve üzerindeki değişim seviyelerinin sürekli olarak rahatsız edici olarak algılandığını, 0,1 ve altındaki değişimlerin ise fark edilir olduğunu ancak aşırı rahatsız edici olmadığını tespit ettik. Bu nedenle, sıfır düzen değişikliği ideal olsa da 0, 1'e kadar olan değerlerin "iyi" CLS eşikleri olduğu sonucuna vardık.

Ulaşılabilirlik

CrUX verilerine dayanarak, başlangıç noktalarının yaklaşık% 50'sinin CLS'nin 0,05 veya daha düşük olduğunu görüyoruz.

"İyi" olarak sınıflandırılan CrUX kaynaklarının yüzdesi (aday CLS eşikleri için)

  0,05 0,1 0,15
phone %49 %60 %69
masaüstü %42 %59 %69

CrUX verileri, 0,05'in makul bir CLS "iyi" eşiği olabileceğini gösterse de düzen kaymalarını önlemenin şu anda zor olduğu bazı kullanım alanlarının olduğunun farkındayız. Örneğin, yerleşik sosyal medya içerikleri gibi üçüncü taraf yerleşik içeriklerde bazen yükleme bitene kadar yerleştirilmiş içeriğin yüksekliği bilinmez.Bu da 0,05'ten büyük bir düzen kaymasına yol açabilir. Bu nedenle, birçok kaynağın 0,05 eşiğini karşılasa da daha az katı olan 0,1 olan CLS eşiği, deneyim kalitesi ile ulaşılabilirlik arasında daha iyi bir denge sağlar. Gelecekte web ekosisteminin, üçüncü taraf yerleştirmelerinin neden olduğu düzen değişikliklerini ele almak amacıyla çözümler bulacağını ve bu sayede Core Web Vitals'ın gelecekteki iterasyonlarında 0,05 veya 0'lık daha katı bir CLS "iyi" eşiğinin kullanılabilmesini umuyoruz.

Buna ek olarak, CLS için "yetersiz" bir eşik belirlemek amacıyla, çoğu kaynağın ulaştığı bir eşiği tanımlamak için CrUX verilerini kullandık:

"Kötü" olarak sınıflandırılan CrUX kaynaklarının yüzdesi (aday CLS eşikleri için)

  0,15 0,2 0,25 0,3
phone %31 %25 %20 %18
masaüstü %31 %23 %18 %16

0,25'lik bir eşik için, telefon kaynaklarının yaklaşık% 20'si ve masaüstü başlangıç noktalarının% 18'i "yetersiz" olarak sınıflandırılır. Bu değer, hedef aralığımız olan %10-30'dur.Bu nedenle, 0,25'in kabul edilebilir "düşük" bir eşik olduğuna karar verdik.