CrUX BigQuery veri kümesi nasıl kullanılır?

Chrome kullanıcı deneyimi raporunun (CrUX) ham verilerine, Google Cloud'daki bir veritabanı olan BigQuery'de erişilebilir. BigQuery'yi kullanmak için bir GCP projesi ve SQL hakkında temel düzeyde bilgi sahibi olmanız gerekir.

Bu kılavuzda, web'deki kullanıcı deneyimlerinin durumuyla ilgili bilgilendirici sonuçlar elde etmek amacıyla CrUX veri kümesine sorgu yazmak için BigQuery'yi nasıl kullanacağınızı öğrenin:

  • Verilerin nasıl düzenlendiğini anlama
  • Kaynakların performansını değerlendirmek için temel bir sorgu yazma
  • Zaman içindeki performansı izlemek için gelişmiş bir sorgu yazma

Veri organizasyonu

Temel bir sorguya bakarak başlayın:

SELECT COUNT(DISTINCT origin) FROM `chrome-ux-report.all.202206`

Sorguyu çalıştırmak için sorgu düzenleyiciye girin ve "Sorguyu çalıştır" düğmesine basın:

Düzenleyiciye basit bir sorgu girip Çalıştır'a basın.

Bu sorgunun iki bölümü vardır:

  • SELECT COUNT(DISTINCT origin), tablodaki kaynak sayısının sorgulanması anlamına gelir. Kabaca söylemek gerekirse, aynı şemaya, ana makineye ve bağlantı noktasına sahip iki URL aynı kaynağın parçasıdır.

  • FROM chrome-ux-report.all.202206, kaynak tablonun adresini belirtir. Bu adres üç bölümden oluşur:

    • Tüm CrUX verilerinin düzenlendiği Cloud projesinin adı chrome-ux-report
    • Tüm ülkelerdeki verileri temsil eden all veri kümesi
    • 202206 tablosu, verilerin yıl ve ayı YYYYMM biçiminde

Ayrıca her ülke için veri kümeleri vardır. Örneğin, chrome-ux-report.country_ca.202206 yalnızca Kanada'dan gelen kullanıcı deneyimi verilerini temsil eder.

Her veri kümesinde, 201710'dan bu yana her ay için tablolar bulunur. Önceki takvim ayına ait yeni tablolar düzenli olarak yayınlanır.

Veri tablolarının yapısı (şema olarak da bilinir) şunları içerir:

  • Kaynak (ör. origin = 'https://www.example.com'), ilgili web sitesindeki tüm sayfalar için birleştirilmiş kullanıcı deneyimi dağılımını temsil eder.
  • Sayfa yüklenirken kullanılan bağlantı hızı (ör. effective_connection_type.name = '4G'
  • Cihaz türü (ör. form_factor.name = 'desktop')
  • Kullanıcı deneyimi metrikleri
    • first_paint (FP)
    • first_contentful_paint (FCP)
    • largest_contentful_paint (LCP)
    • dom_content_loaded (DCL)
    • onload (OL)
    • layout_instability.cumulative_layout_shift (CLS)
    • interaction_to_next_paint (INP)

Her metriğe ait veriler bir nesne dizisi olarak düzenlenir. JSON notasyonunda first_contentful_paint.histogram.bin aşağıdaki gibi görünür:

[
    {"start": 0, "end": 100, "density": 0.1234},
    {"start": 100, "end": 200, "density": 0.0123},
    ...
]

Her bölmede, milisaniye cinsinden başlangıç ve bitiş zamanı ile bu zaman aralığındaki kullanıcı deneyimlerinin yüzdesini temsil eden bir yoğunluk bulunur. Diğer bir deyişle, bu varsayımsal kaynak, bağlantı hızı ve cihaz türü için FCP deneyimlerinin% 12, 34'ü 100 ms'den kısadır. Tüm kutu yoğunluklarının toplamı %100'dür.

BigQuery'deki tabloların yapısına göz atın.

Performans değerlendirme

Bu performans verilerini çıkaran bir sorgu yazmak için tablo şeması hakkındaki bilgilerimizi kullanabiliriz.

SELECT
  fcp
FROM
  `chrome-ux-report.all.202206`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  origin = 'https://web.dev' AND
  effective_connection_type.name = '4G' AND
  form_factor.name = 'phone' AND
  fcp.start = 0

BigQuery'de CrUX FCP'yi sorgulama

Sonuç 0.01115. Yani bu kaynaktaki kullanıcı deneyimlerinin% 1, 115'i 4G ve telefonda 0-100 ms. arasındadır. Sorgumuzu tüm bağlantılar ve cihaz türleri için genelleştirmek istersek bunları WHERE yan tümcesinden çıkarabilir ve ilgili tüm kutu yoğunluklarını toplamak için SUM toplayıcı işlevini kullanabiliriz:

SELECT
  SUM(fcp.density)
FROM
  `chrome-ux-report.all.202206`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  origin = 'https://web.dev' AND
  fcp.start = 0

BigQuery'de CrUX FCP'yi toplama

Sonuç 0.05355 veya tüm cihaz ve bağlantı türleri genelinde% 5, 355'tir. Sorguyu biraz değiştirebilir ve 0-1.000 ms arasındaki "hızlı" FCP aralığındaki tüm bölmelerin yoğunluğunu ekleyebiliriz:

SELECT
  SUM(fcp.density) AS fast_fcp
FROM
  `chrome-ux-report.all.202206`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  origin = 'https://web.dev' AND
  fcp.start < 1000

BigQuery&#39;de hızlı FCP&#39;yi sorgulama

Bu bize 0.6977 kazandırıyor. Diğer bir deyişle, web.dev'deki FCP kullanıcı deneyimlerinin% 69,77'si, FCP aralığı tanımına göre "hızlı" olarak kabul edilir.

Performansı izleme

Bir kaynakla ilgili performans verilerini ayıkladık. Artık bu verileri eski tablolardaki geçmiş verilerle karşılaştırabiliriz. Bunu yapmak için tablo adresini daha önceki bir aya göre yeniden yazabilir veya tüm ayları sorgulamak için joker karakter söz dizimini kullanabiliriz:

SELECT
  _TABLE_SUFFIX AS yyyymm,
  SUM(fcp.density) AS fast_fcp
FROM
  `chrome-ux-report.all.*`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  origin = 'https://web.dev' AND
  fcp.start < 1000
GROUP BY
  yyyymm
ORDER BY
  yyyymm DESC

BigQuery&#39;de CrUX FCP zaman serisini sorgulama

Burada, hızlı FCP deneyimlerinin yüzdesinin her ay birkaç yüzde puanı değiştiğini görüyoruz.

yyyyaa fast_fcp
202206 %69,77
202205 %70,71
202204 %69,04
202203 %69,82
202202 %67,75
202201 %58,96
202112 %41,69
... ...

Bu tekniklerle bir kaynağın performansını arayabilir, hızlı deneyimlerin yüzdesini hesaplayabilir ve zaman içinde izleyebilirsiniz. Sonraki adımda, iki veya daha fazla kaynak için sorgu oluşturmayı ve performanslarını karşılaştırmayı deneyin.

SSS

CrUX BigQuery veri kümesiyle ilgili sık sorulan sorulardan bazıları şunlardır:

Diğer araçlar yerine BigQuery'yi ne zaman kullanırım?

BigQuery yalnızca CrUX kontrol paneli ve PageSpeed Insights gibi diğer araçlardan aynı bilgileri alamadığınız durumlarda gereklidir. Örneğin, BigQuery, verileri anlamlı şekillerde dilimlemenize ve hatta bazı gelişmiş veri madenciliği işlemleri yapmak için HTTP Archive gibi diğer herkese açık veri kümeleriyle birleştirmenize olanak tanır.

BigQuery'yi kullanmayla ilgili herhangi bir sınırlama var mı?

Evet, en önemli sınırlama, kullanıcıların varsayılan olarak ayda yalnızca 1 TB boyutunda veri sorgulayabilmesidir. Bu kotanın üzerindeki kullanımlar için 1 TB başına 5 ABD doları olan standart ücret geçerlidir.

BigQuery hakkında daha fazla bilgiyi nereden edinebilirim?

Daha fazla bilgi için BigQuery belgelerini inceleyin.