你可以在 BigQuery (Google Cloud 上的資料庫) 中取得 Chrome 使用者體驗報告 (CrUX) 的原始資料。使用 BigQuery 需具備 GCP 專案,且須對 SQL 有基本知識。
本指南將說明如何使用 BigQuery 針對 CrUX 資料集編寫查詢,擷取有關網站使用者體驗狀態的深入分析結果:
- 瞭解資料的編排方式
- 編寫基本查詢來評估來源的效能
- 編寫進階查詢,追蹤一段時間內的效能
資料組織
從基本查詢開始:
SELECT COUNT(DISTINCT origin) FROM `chrome-ux-report.all.202206`
如要執行查詢,請在查詢編輯器中輸入查詢,然後按下「Run query」(執行查詢) 按鈕:
這項查詢包含兩個部分:
SELECT COUNT(DISTINCT origin)
是指查詢資料表中的起點數。大致來說,如果兩個網址的配置、主機和通訊埠都相同,這些網址就屬於相同來源。FROM chrome-ux-report.all.202206
會指定來源資料表的地址,其中包含三個部分:- 所有 CrUX 資料的 Cloud 專案名稱
chrome-ux-report
- 資料集
all
,代表所有國家/地區的資料 202206
表格,代表資料的年份和月份,格式為 YYYYMM
- 所有 CrUX 資料的 Cloud 專案名稱
還有各個國家/地區的資料集。舉例來說,chrome-ux-report.country_ca.202206
只代表源自加拿大的使用者體驗資料。
每個資料集內都會有自 201710 年起每個月的資料表。系統會定期發布前一個月的新資料表。
資料表的結構 (也稱為「結構定義」) 包括:
- 來源 (例如
origin = 'https://www.example.com'
),代表該網站上所有網頁的匯總使用者體驗分布 - 網頁載入時的連線速度,例如
effective_connection_type.name = '4G'
- 裝置類型,例如
form_factor.name = 'desktop'
- 使用者體驗指標本身
每個指標的資料會以物件陣列的形式整理。在 JSON 符號中,first_contentful_paint.histogram.bin
會類似於以下內容:
[
{"start": 0, "end": 100, "density": 0.1234},
{"start": 100, "end": 200, "density": 0.0123},
...
]
每個區塊都包含起始和結束時間 (以毫秒為單位),以及代表該時間範圍內使用者體驗百分比的密度。換句話說,在這個假設的來源、連線速度和裝置類型中,有 12.34% 的 FCP 體驗時間低於 100 毫秒。所有分箱密度的總和為 100%。
評估成效
我們可以利用對資料表結構定義的瞭解,編寫可擷取這類成效資料的查詢。
SELECT
fcp
FROM
`chrome-ux-report.all.202206`,
UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
origin = 'https://web.dev' AND
effective_connection_type.name = '4G' AND
form_factor.name = 'phone' AND
fcp.start = 0
結果為 0.01115
,表示在 4G 和手機上,此來源有 1.115% 的使用者體驗介於 0 到 100 毫秒之間。如果我們想將查詢推廣至任何連線和任何裝置類型,可以從 WHERE
子句中省略這些項目,並使用 SUM
匯總函式來加總所有相應的資料箱密度:
SELECT
SUM(fcp.density)
FROM
`chrome-ux-report.all.202206`,
UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
origin = 'https://web.dev' AND
fcp.start = 0
結果為 0.05355
,也就是所有裝置和連線類型的 5.355%。我們可以稍微修改查詢,並將「快速」FCP 範圍 (0 到 1000 毫秒) 內的所有區塊密度加總:
SELECT
SUM(fcp.density) AS fast_fcp
FROM
`chrome-ux-report.all.202206`,
UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
origin = 'https://web.dev' AND
fcp.start < 1000
得到了 0.6977
。換句話說,根據 FCP 範圍定義,在 web.dev 上的 FCP 使用者體驗中,有 69.77% 的使用者體驗會被視為「快速」。
追蹤成效
我們已擷取來源網址的成效資料,現在可以將這些資料與舊版資料表中的歷來資料進行比較。為此,我們可以將資料表位址重寫為較早的月份,也可以使用萬用字元語法查詢所有月份:
SELECT
_TABLE_SUFFIX AS yyyymm,
SUM(fcp.density) AS fast_fcp
FROM
`chrome-ux-report.all.*`,
UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
origin = 'https://web.dev' AND
fcp.start < 1000
GROUP BY
yyyymm
ORDER BY
yyyymm DESC
這裡顯示,快速 FCP 體驗的百分比每個月都會變化幾個百分點。
yyyymm | fast_fcp |
---|---|
202206 | 69.77% |
202205 | 70.71% |
202204 | 69.04% |
202203 | 69.82% |
202202 | 67.75% |
202201 | 58.96% |
202112 | 41.69% |
... | ... |
透過這些技術,您可以查詢來源的效能、計算快速體驗的百分比,並追蹤這項數據隨時間的變化。下一步,請嘗試查詢兩個以上的來源,並比較成效。
常見問題
以下是一些與 CrUX BigQuery 資料集相關的常見問題:
何時應使用 BigQuery,而不是其他工具?
只有在無法從 CrUX 資訊主頁和 PageSpeed Insights 等其他工具取得相同資訊時,才需要使用 BigQuery。舉例來說,您可以使用 BigQuery 以有意義的方式切割資料,甚至將資料與 HTTP Archive 等其他公開資料集彙整,以進行一些進階資料挖掘作業。
使用 BigQuery 時是否有任何限制?
是,最重要的限制是根據預設,使用者每月只能查詢 1 TB 的資料。超過這個數量,系統會以 $5/TB 的標準費率收費。
我想進一步瞭解 BigQuery,該怎麼做?
詳情請參閱 BigQuery 說明文件。