การกำหนดเกณฑ์เมตริก Core Web Vitals

การวิจัยและระเบียบวิธีซึ่งอยู่เบื้องหลังเกณฑ์ Core Web Vitals

Bryan McQuade
Bryan McQuade

Core Web Vitals คือชุดเมตริกภาคสนามที่วัดแง่มุมที่สำคัญของประสบการณ์ของผู้ใช้จริงบนเว็บ Core Web Vitals ประกอบด้วยเมตริกและเกณฑ์เป้าหมายสำหรับแต่ละเมตริก ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์เข้าใจในเชิงคุณภาพว่าประสบการณ์ของเว็บไซต์ "ดี" "ต้องปรับปรุง" หรือ "แย่" โพสต์นี้จะอธิบายถึงแนวทางที่ใช้เลือกเกณฑ์สำหรับเมตริก Core Web Vitals โดยทั่วไป รวมถึงวิธีเลือกเกณฑ์สำหรับเมตริก Core Web Vitals ที่เจาะจงแต่ละรายการ

ทบทวนความรู้: เมตริกและเกณฑ์ของ Core Web Vitals

ในปี 2020 Core Web Vitals ประกอบด้วย 3 เมตริก ได้แก่ Largest Contentful Paint (LCP), First Input Delay (FID) และ Cumulative Layout Shift (CLS) เมตริกแต่ละรายการจะวัดประสบการณ์ของผู้ใช้ในด้านที่ต่างกัน โดย LCP จะวัดความเร็วในการโหลดที่รับรู้ได้และทำเครื่องหมายจุดในไทม์ไลน์การโหลดหน้าเว็บเมื่อเนื้อหาหลักของหน้าโหลดอยู่, FID จะวัดการตอบสนองและจำนวนประสบการณ์ที่ผู้ใช้รู้สึกเมื่อพยายามโต้ตอบกับหน้าเว็บเป็นครั้งแรก และ CLS จะวัดความเสถียรของภาพและจำนวนการเปลี่ยนแปลงเลย์เอาต์ที่ไม่คาดคิดของเนื้อหาในหน้าที่มองเห็นได้

เมตริก Core Web Vitals แต่ละรายการมีเกณฑ์ที่เกี่ยวข้องกัน ซึ่งจัดหมวดหมู่ประสิทธิภาพเป็น "ดี" "ต้องปรับปรุง" หรือ "แย่" ดังนี้

คำแนะนำเกณฑ์ Largest Contentful Paint คำแนะนำเกณฑ์ความล่าช้าของอินพุตแรก คำแนะนำเกณฑ์ Cumulative Layout Shift
  เร็ว แย่ เปอร์เซ็นไทล์
การแสดงผลเนื้อหาขนาดใหญ่ที่สุด ≤ 2,500 มิลลิวินาที > 4,000 มิลลิวินาที 75
ความล่าช้าของอินพุตครั้งแรก ≤ 100 มิลลิวินาที > 300 มิลลิวินาที 75
การเปลี่ยนเลย์เอาต์สะสม อย่างน้อย 0.1 > 0.25 75

นอกจากนี้ ในการแยกประเภทประสิทธิภาพโดยรวมของหน้าเว็บหรือเว็บไซต์ เราจะใช้ค่าเปอร์เซ็นไทล์ที่ 75 ของการดูหน้าเว็บทั้งหมดสำหรับหน้าเว็บหรือเว็บไซต์นั้นๆ กล่าวคือ หากการดูหน้าเว็บอย่างน้อย 75 เปอร์เซ็นต์ในเว็บไซต์เป็นไปตามเกณฑ์ "ดี" เว็บไซต์นั้นจะได้รับการจัดประเภทว่ามีประสิทธิภาพ "ดี" สำหรับเมตริกนั้น ในทางกลับกัน หากอย่างน้อย 25% ของการดูหน้าเว็บตรงตามเกณฑ์ "แย่" ก็จะถือว่าเว็บไซต์นั้นมีประสิทธิภาพ "แย่" ตัวอย่างเช่น LCP เปอร์เซ็นไทล์ที่ 75 ที่มีค่า 2 วินาทีจะได้รับการจัดประเภทเป็น "ดี" ขณะที่ LCP เปอร์เซ็นไทล์ที่ 75 ที่มีค่า 5 วินาทีจะได้รับการจัดประเภทเป็น "ช้า"

เกณฑ์สำหรับเกณฑ์เมตริก Core Web Vitals

เมื่อสร้างเกณฑ์สำหรับเมตริก Core Web Vitals เราจะระบุเกณฑ์ที่ตรงตามเกณฑ์แต่ละรายการก่อน ด้านล่างนี้ เราจะอธิบายเกณฑ์ที่เราใช้ที่ Google ในการประเมินเกณฑ์เมตริก Core Web Vitals ปี 2020 ส่วนต่อๆ ไปจะอธิบายรายละเอียดเพิ่มเติมเกี่ยวกับวิธีนำเกณฑ์เหล่านี้ไปใช้ในการเลือกเกณฑ์สำหรับแต่ละเมตริกในปี 2020 ในปีต่อๆ ไป เราคาดว่าจะปรับปรุงและเพิ่มเกณฑ์และเกณฑ์เพื่อปรับปรุงความสามารถในการวัดผลประสบการณ์ของผู้ใช้ที่ยอดเยี่ยมบนเว็บให้ดียิ่งขึ้น

ประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง

เป้าหมายหลักของเราคือการเพิ่มประสิทธิภาพสำหรับผู้ใช้และคุณภาพประสบการณ์ของผู้ใช้ เราจึงตั้งเป้าที่จะดูแลให้หน้าเว็บที่เป็นไปตามเกณฑ์ "ที่ดี" ของ Core Web Vitals มอบประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง

ในการระบุเกณฑ์ที่เกี่ยวข้องกับประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง เราจะพิจารณาจากการรับรู้ของมนุษย์และการวิจัย HCI แม้ว่าบางครั้งการวิจัยนี้จะสรุปโดยใช้เกณฑ์คงที่เกณฑ์เดียว แต่เราพบว่างานวิจัยที่เกี่ยวข้องมักแสดงเป็นช่วงของค่า เช่น การวิจัยเกี่ยวกับระยะเวลาที่ผู้ใช้มักจะรอก่อนที่จะสูญเสียโฟกัส บางครั้งอาจอธิบายว่า 1 วินาที ในขณะที่การวิจัยที่สำคัญจะแสดงเป็นช่วงตั้งแต่หลายร้อยมิลลิวินาทีไปจนถึงหลายวินาที เกณฑ์การรับรู้จะแตกต่างกันไปโดยขึ้นอยู่กับผู้ใช้และบริบทยังได้รับการรองรับเพิ่มเติมจากข้อมูลเมตริก Chrome แบบสรุปรวมและไม่ระบุตัวตน ซึ่งแสดงให้เห็นว่าผู้ใช้ไม่ได้รอเป็นเวลาสั้นๆ ที่หน้าเว็บแสดงเนื้อหาก่อนที่จะล้มเลิกการโหลดหน้าเว็บ ข้อมูลนี้แสดงการกระจายที่ราบรื่นและต่อเนื่อง ดูรายละเอียดเพิ่มเติมเกี่ยวกับเกณฑ์การรับรู้ของมนุษย์และการวิจัย HCI ที่เกี่ยวข้องได้ที่ The Science Behind Web Vitals

ในกรณีที่มีการวิจัยประสบการณ์ของผู้ใช้ที่เกี่ยวข้องสำหรับเมตริกหนึ่งๆ และมีความเห็นพ้องที่สมเหตุสมผลเกี่ยวกับช่วงของค่าในวรรณกรรม เราจะใช้ช่วงนี้เป็นอินพุตเพื่อเป็นแนวทางในกระบวนการเลือกเกณฑ์ของเรา ในกรณีที่ไม่มีข้อมูลการศึกษาประสบการณ์ของผู้ใช้ที่เกี่ยวข้อง เช่น สำหรับเมตริกใหม่อย่าง Cumulative Layout Shift เราจะประเมินหน้าเว็บในชีวิตจริงซึ่งตรงตามเกณฑ์ของเมตริกที่ต่างออกไป เพื่อระบุเกณฑ์ที่ทำให้ผู้ใช้ได้รับประสบการณ์ที่ดี

บรรลุเป้าหมายได้ด้วยเนื้อหาเว็บที่มีอยู่

นอกจากนี้ เพื่อให้มั่นใจว่าเจ้าของเว็บไซต์จะเพิ่มประสิทธิภาพเว็บไซต์ของตนให้ตรงตามเกณฑ์ "ที่ดี" ได้ เราจึงกำหนดให้เกณฑ์เหล่านี้ใช้ได้กับเนื้อหาที่มีอยู่บนเว็บ เช่น แม้ว่าค่า 0 มิลลิวินาทีจะเท่ากับเกณฑ์ "ดี" ของ LCP ในอุดมคติ ซึ่งส่งผลให้ได้รับประสบการณ์การโหลดทันที แต่ในกรณีส่วนใหญ่ เกณฑ์ที่ 0 มิลลิวินาทีก็ใช้งานไม่ได้จริงเนื่องจากเวลาในการตอบสนองในการประมวลผลเครือข่ายและอุปกรณ์ ดังนั้น 0 มิลลิวินาทีจึงไม่ใช่เกณฑ์ LCP ที่ "ดี" สำหรับ Core Web Vitals

เมื่อประเมินเกณฑ์ "ที่ดี" ของ Core Web Vitals เราจะตรวจสอบว่าเกณฑ์ดังกล่าวเป็นจริงได้โดยอิงตามข้อมูลจากรายงานประสบการณ์ของผู้ใช้ Chrome (CrUX) เรากำหนดให้ต้นทางอย่างน้อย 10% มีคุณสมบัติตามเกณฑ์ "ที่ดี" ในปัจจุบันเพื่อให้มั่นใจว่าเกณฑ์จะทำงานได้ นอกจากนี้ เพื่อให้มั่นใจว่าเว็บไซต์ที่เพิ่มประสิทธิภาพมาอย่างดีจะไม่ถูกจัดประเภทอย่างไม่ถูกต้องเนื่องจากความแปรปรวนของข้อมูลภาคสนาม เราจะตรวจสอบด้วยว่าเนื้อหาที่ได้รับการปรับปรุงอย่างเหมาะสมนั้นเป็นไปตามเกณฑ์ "ที่ดี" อย่างสม่ำเสมอ

ในทางกลับกัน เรากำหนดเกณฑ์ "แย่" โดยระบุระดับประสิทธิภาพที่มีแหล่งที่มาเพียงไม่กี่แห่งที่ยังไม่บรรลุผลในปัจจุบัน นอกจากจะมีงานวิจัยที่เกี่ยวข้องกับการกำหนดเกณฑ์ "แย่" โดยค่าเริ่มต้นแล้ว 10-30% ของต้นทางที่มีประสิทธิภาพแย่ที่สุดจะได้รับการจัดประเภทเป็น "ช้า"

ความคิดขั้นสุดท้ายเกี่ยวกับเกณฑ์

เมื่อประเมินเกณฑ์ของผู้สมัคร เราพบว่าบางครั้งเกณฑ์อาจขัดแย้งกัน เช่น คุณอาจพบความตึงเครียดระหว่างเกณฑ์ที่จะทำให้ได้อย่างต่อเนื่องและเพื่อให้ผู้ใช้ได้รับประสบการณ์ที่ดีอย่างต่อเนื่อง นอกจากนี้ งานวิจัยการรับรู้ของมนุษย์โดยทั่วไปจะให้ข้อมูลค่าต่างๆ และเมตริกพฤติกรรมผู้ใช้แสดงการเปลี่ยนแปลงด้านพฤติกรรมอย่างค่อยเป็นค่อยไป เราพบว่ามักไม่มีเกณฑ์ที่ "ถูกต้อง" เพียงอย่างเดียวสำหรับเมตริก ดังนั้น แนวทางสำหรับ Core Web Vitals ปี 2020 เราจึงต้องเลือกเกณฑ์ที่ตรงกับเกณฑ์ข้างต้นมากที่สุด แต่ตระหนักว่าไม่มีเกณฑ์ใดเกณฑ์หนึ่งที่สมบูรณ์แบบ และบางครั้งเราอาจจำเป็นต้องเลือกจากเกณฑ์ที่มีเหตุผลสมควรสำหรับผู้สมัครหลายเกณฑ์ แทนที่จะถามว่า "เกณฑ์ที่สมบูรณ์แบบ คืออะไร" เราโฟกัสที่การถามว่า "เกณฑ์ของผู้สมัครใดที่มีคุณสมบัติตามเกณฑ์มากที่สุด"

ตัวเลือกเปอร์เซ็นไทล์

ดังที่กล่าวไว้ก่อนหน้านี้ ในการจัดประเภทประสิทธิภาพโดยรวมของหน้าเว็บหรือเว็บไซต์ เราจะใช้ค่าเปอร์เซ็นไทล์ที่ 75 ของการเข้าชมทั้งหมดที่ไปยังหน้าเว็บหรือเว็บไซต์นั้นๆ เปอร์เซ็นไทล์ที่ 75 ได้รับเลือกตามเกณฑ์ 2 ข้อ ข้อแรก เปอร์เซ็นไทล์ควรแน่ใจว่าการเข้าชมหน้าเว็บหรือเว็บไซต์ส่วนใหญ่มีประสบการณ์ที่ระดับเป้าหมาย ประการที่ 2 ค่าของเปอร์เซ็นไทล์ที่เลือกไม่ควรได้รับผลกระทบจากค่าผิดปกติ

เป้าหมายเหล่านี้ค่อนข้างสวนทางกัน เพื่อให้บรรลุเป้าหมายแรก เปอร์เซ็นต์ไทล์ที่สูงกว่ามักจะเป็นทางเลือกที่ดีกว่า อย่างไรก็ตาม สำหรับเปอร์เซ็นไทล์ที่สูงขึ้น แนวโน้มที่ค่าผลลัพธ์จะได้รับผลกระทบจากค่าผิดปกติก็จะเพิ่มขึ้นด้วย หากการเข้าชมเว็บไซต์ 2-3 ครั้งเกิดขึ้นจากการเชื่อมต่อเครือข่ายที่ไม่สม่ำเสมอ ซึ่งส่งผลให้มีตัวอย่าง LCP ที่มีขนาดใหญ่เกินไป เราไม่ต้องการให้การจัดประเภทเว็บไซต์ดังกล่าวตัดสินจากตัวอย่างที่มีค่าผิดปกติเหล่านี้ ตัวอย่างเช่น หากเราประเมินประสิทธิภาพของเว็บไซต์ที่มีการเข้าชม 100 ครั้งโดยใช้เปอร์เซ็นไทล์สูง เช่น ค่าเปอร์เซ็นต์ที่ 95 ระบบจะใช้ค่าผิดปกติ 5 ตัวอย่างสำหรับค่าเปอร์เซ็นไทล์ที่ 95 ที่จะได้รับผลกระทบจากค่าผิดปกติ

เนื่องจากเป้าหมายเหล่านี้ค่อนข้างขัดแย้งกัน หลังการวิเคราะห์ เราจึงสรุปว่าเปอร์เซ็นไทล์ที่ 75 นั้นสมดุลพอสมควร เมื่อใช้เปอร์เซ็นไทล์ที่ 75 เราจะทราบว่าการเข้าชมเว็บไซต์ส่วนใหญ่ (3 จาก 4) มีประสิทธิภาพถึงระดับเป้าหมายหรือดีกว่า นอกจากนี้ ค่าเปอร์เซ็นไทล์ที่ 75 ยังมีแนวโน้มที่จะได้รับผลกระทบจากค่าผิดปกติน้อยกว่า กลับไปที่ตัวอย่างของเรา สำหรับเว็บไซต์ที่มีการเข้าชม 100 ครั้ง การเข้าชม 25 ครั้งจะต้องรายงานตัวอย่างค่าผิดปกติขนาดใหญ่สำหรับค่าที่เปอร์เซ็นไทล์ที่ 75 ที่จะได้รับผลกระทบจากค่าผิดปกติ แม้ว่าตัวอย่าง 25 จาก 100 รายการจะเป็นค่าที่ผิดปกติได้ แต่มีโอกาสน้อยกว่ากรณีของเปอร์เซ็นไทล์ที่ 95 มาก

การแสดงผลเนื้อหาขนาดใหญ่ที่สุด

คุณภาพของประสบการณ์

เวลา 1 วินาทีมักจะหมายถึงระยะเวลาที่ผู้ใช้จะต้องรอก่อนที่เขาจะเริ่มเลิกจดจ่อกับงานหนึ่งๆ จากการตรวจสอบงานวิจัยที่เกี่ยวข้องโดยละเอียด เราพบว่า 1 วินาทีเป็นค่าประมาณที่จะอธิบายช่วงของค่าต่างๆ ตั้งแต่ประมาณหลายร้อยมิลลิวินาทีไปจนถึงหลายวินาที

แหล่งที่มาที่อ้างอิงกันโดยทั่วไป 2 รายการสำหรับเกณฑ์ 1 วินาที ได้แก่ บัตร และอื่นๆ และ Miller การ์ดกำหนดเกณฑ์ "การตอบสนองทันที" ความยาว 1 วินาที โดยอ้างอิงทฤษฎีการเรียนรู้แบบรวมของ Newell นีเวลอธิบายการตอบสนองทันทีว่าเป็น "การตอบสนองที่ต้องทำกับสิ่งเร้าบางอย่างภายในประมาณ 1 วินาที (ประมาณ 0.3 วินาทีถึง ~3 วินาที)" ส่วนนี้มาจากการพูดคุยของ Newell เกี่ยวกับ "ข้อจำกัดแบบเรียลไทม์เกี่ยวกับการรับรู้" โดยมีหมายเหตุว่า "การโต้ตอบกับสภาพแวดล้อมที่ทำให้เกิดการพิจารณาทางความคิดจะเกิดขึ้นตามลำดับวินาที" ซึ่งมีช่วงประมาณ 0.5 ถึง 2-3 วินาที Miller ซึ่งเป็นอีกแหล่งข้อมูลหนึ่งที่มีการอ้างถึงกันโดยทั่วไปสำหรับเกณฑ์ 1 วินาที โดยกล่าวว่า "งานที่มนุษย์ทำได้และจะดำเนินการผ่านระบบสื่อสารด้วยคอมพิวเตอร์จะเปลี่ยนลักษณะนิสัยของมนุษย์ไปอย่างมากหากความล่าช้าในการตอบสนองนานกว่า 2 วินาที โดยอาจขยายไปได้อีกประมาณ 2 วินาที"

งานวิจัยของ Miller และ Card อธิบายระยะเวลาที่ผู้ใช้จะรอก่อนที่จะสูญเสียโฟกัสเป็นช่วงๆ ไปตั้งแต่ประมาณ 0.3 ถึง 3 วินาที ซึ่งชี้ให้เห็นว่าเกณฑ์ "ดี" ของ LCP ควรอยู่ในช่วงนี้ นอกจากนี้ เนื่องจากเกณฑ์ "ดี" ของ First Contentful Paint ที่มีอยู่คือ 1 วินาที และโดยทั่วไปแล้ว การแสดงผลเนื้อหาขนาดใหญ่ที่สุดจะเกิดขึ้นหลังจาก First Contentful Paint ตามปกติ เราจึงจำกัดเกณฑ์ LCP ของผู้สมัครได้มากขึ้นจาก 1 วินาทีถึง 3 วินาที หากต้องการเลือกเกณฑ์ในช่วงนี้ที่ตรงกับเกณฑ์ของเรามากที่สุด เราจะมาดูความสามารถในการบรรลุเกณฑ์ของผู้สมัครเหล่านี้ด้านล่าง

ความสำเร็จ

เราใช้ข้อมูลจาก CrUX เพื่อระบุเปอร์เซ็นต์ของต้นทางในเว็บที่ตรงตามเกณฑ์ LCP ที่เป็นตัวเลือก "ดี" ของผู้สมัคร

% ของต้นทาง CrUX ที่จัดประเภทเป็น "ดี" (สำหรับเกณฑ์ LCP ของผู้สมัคร)

  1 วินาที 1.5 วินาที 2 วินาที 2.5 วินาที 3 วินาที
phone 3.5% 13% 27% 42% 55%
เดสก์ท็อป 6.9% 19% 36% เร็วขึ้น 64%

แม้ว่าต้นทางไม่ถึง 10% ตรงตามเกณฑ์ 1 วินาที แต่เกณฑ์อื่นๆ ทั้งหมดตั้งแต่ 1.5-3 วินาทีเป็นไปตามข้อกำหนดของเราว่าอย่างน้อย 10% ของต้นทางเป็นไปตามเกณฑ์ "ดี" จึงยังคงเป็นตัวเลือกที่ใช้ได้

นอกจากนี้ เรายังวิเคราะห์ประสิทธิภาพ LCP สำหรับเว็บไซต์ที่มีประสิทธิภาพสูงสุดทั่วทั้งอินเทอร์เน็ตเพื่อตัดสินว่าเกณฑ์ใดใช้งานได้อย่างสม่ำเสมอสำหรับเว็บไซต์เหล่านี้ เพื่อให้มั่นใจว่าเกณฑ์ที่เลือกจะเป็นไปได้อย่างสม่ำเสมอสำหรับเว็บไซต์ที่ได้รับการเพิ่มประสิทธิภาพมาอย่างดี โดยเฉพาะอย่างยิ่ง เรามุ่งหวังที่จะระบุเกณฑ์ที่สามารถบรรลุผลได้อย่างสม่ำเสมอที่เปอร์เซ็นไทล์ที่ 75 สำหรับเว็บไซต์ที่มีประสิทธิภาพสูงสุด เราพบว่าเกณฑ์ 1.5 และ 2 วินาทีไม่สามารถบรรลุผลได้อย่างสม่ำเสมอ ในขณะที่ 2.5 วินาทีนั้นทำได้อย่างสม่ำเสมอ

ในการระบุเกณฑ์ LCP ที่ "แย่" เราใช้ข้อมูล CrUX เพื่อระบุเกณฑ์ที่ต้นทางส่วนใหญ่ตรวจพบ ดังนี้

% ของต้นทาง CrUX ที่จัดเป็นประเภท "ช้า" (สำหรับเกณฑ์ LCP ของผู้สมัคร)

  3 วินาที 3.5 วินาที 4 วินาที 4.5 วินาที 5 วินาที
phone 45% 35% 26% 20% 15%
เดสก์ท็อป 36% 26% 19% 14% 10%

สำหรับเกณฑ์ 4 วินาที ประมาณ 26% ของต้นทางโทรศัพท์และ 21% ของต้นทางเดสก์ท็อป จะได้รับการจัดประเภทว่า "ช้า" ซึ่งอยู่ในช่วงเป้าหมาย 10-30% เราจึงสรุปว่า 4 วินาทีเป็นเกณฑ์ที่ "แย่" ที่ยอมรับได้

เราจึงสรุปว่า 2.5 วินาทีเป็นเกณฑ์ "ดี" ที่สมเหตุสมผล และ 4 วินาทีเป็นเกณฑ์ที่ "แย่" ที่สมเหตุสมผลสำหรับ Largest Contentful Paint

ความล่าช้าของอินพุตครั้งแรก

คุณภาพของประสบการณ์

การวิจัยมีความสอดคล้องพอสมควรในการสรุปว่าความล่าช้าในการตอบสนองด้วยภาพสูงสุดประมาณ 100 มิลลิวินาทีถูกมองว่าเกิดจากแหล่งที่มาที่เกี่ยวข้อง เช่น ข้อมูลจากผู้ใช้ ซึ่งหมายความว่าเกณฑ์ "ดี" ของ First Input Delay ที่ "ดี" อยู่ที่ 100 มิลลิวินาทีจึงเหมาะสำหรับเกณฑ์ขั้นต่ำ นั่นคือ หากความล่าช้าในการประมวลผลอินพุตเกิน 100 มิลลิวินาที ก็จะทำให้การประมวลผลและขั้นตอนการแสดงผลอื่นๆ เสร็จสิ้นได้ทันเวลา

เวลาตอบสนอง: ขีดจำกัดสำคัญ ที่ Jakob Nielsen อ้างถึงโดยทั่วไปคือ 0.1 วินาที ซึ่งเป็นขีดจำกัดที่ผู้ใช้จะรู้สึกว่าระบบตอบสนองทันที Nielsen อ้างอิง Miller และ Card ที่กล่าวถึง The Perception of Causality ของ Michotte ในปี 1962 ในการวิจัยของ Michotte ผู้เข้าร่วมการทดลองจะเห็น "วัตถุ 2 ชิ้นบนหน้าจอ ออบเจ็กต์ A ทำการตั้งค่าแล้วเคลื่อนเข้าหา B มันจะหยุดในขณะที่สัมผัสกับ ข ส่วนตอนหลังจะเริ่มแล้วจาก ข" Michotte จะเปลี่ยนช่วงเวลาระหว่างที่ออบเจ็กต์ A หยุดและเวลาที่ออบเจ็กต์ B เริ่มเคลื่อนที่ Michotte พบว่า ผู้เข้าร่วมจะรู้สึกว่าออบเจ็กต์ A ทำให้เกิดการเคลื่อนที่ของออบเจ็กต์ B เพื่อให้ล่าช้าถึงประมาณ 100 มิลลิวินาที สำหรับความล่าช้าตั้งแต่ประมาณ 100 ถึง 200 มิลลิวินาที การรับรู้เกี่ยวกับความเป็นเหตุเป็นผลจะผสมผสานกัน และสำหรับความล่าช้าที่นานกว่า 200 มิลลิวินาที ระบบจะไม่เห็นว่าการเคลื่อนไหวของออบเจ็กต์ B เกิดจากวัตถุ A อีกต่อไป

ในทำนองเดียวกัน มิลเลอร์กำหนดเกณฑ์การตอบกลับสำหรับ "การตอบสนองต่อการควบคุมการเปิดใช้งาน" เป็น "สัญญาณบอกถึงการดำเนินการที่กำหนด โดยปกติแล้ว ตามการเคลื่อนไหวของคีย์ สวิตช์ หรือสมาชิกควบคุมอื่นๆ ที่ส่งสัญญาณว่ามีคนเคลื่อนไหวร่างกาย การตอบสนองนี้ควรรับรู้เป็นส่วนหนึ่งของปฏิกิริยาเชิงกล ที่เกิดจากโอเปอเรเตอร์ การหน่วงเวลา: ไม่เกิน 0.1 วินาที" และหลังจากนั้น "ความล่าช้าระหว่างการกดคีย์และการตอบสนองที่เป็นภาพไม่ควรเกิน 0.1 ถึง 0.2 วินาที"

เมื่อเร็วๆ นี้ ใน Towards the Temporally Perfect Virtual Button นั้น Kaaresoja และคณะได้ตรวจสอบความรู้สึกของการทำงานพร้อมกันระหว่างการแตะปุ่มเสมือนบนหน้าจอสัมผัสและการตอบสนองที่เป็นภาพหลังจากนั้นซึ่งบ่งชี้ว่ามีการแตะปุ่มดังกล่าว ซึ่งทำให้มีความล่าช้าหลายระดับ เมื่อความล่าช้าระหว่างการกดปุ่มและการตอบสนองที่เป็นภาพไม่เกิน 85 มิลลิวินาที ผู้เข้าร่วมรายงานว่าฟีดแบ็กที่เป็นภาพปรากฏขึ้นพร้อมกันโดยกดปุ่ม 75% จากเวลาทั้งหมด นอกจากนี้ สำหรับความล่าช้า 100 มิลลิวินาทีหรือต่ำกว่า ผู้เข้าร่วมได้รายงานว่าปุ่มมีคุณภาพที่รับรู้ได้สูงอย่างสม่ำเสมอ โดยคุณภาพที่รับรู้ได้ลดลงจากความล่าช้า 100 มิลลิวินาทีถึง 150 มิลลิวินาที และระดับต่ำมากไปเป็น 300 มิลลิวินาที

จากสิ่งต่างๆ ข้างต้น เราได้สรุปว่าการวิจัยได้ชี้ให้เห็นช่วงค่าต่างๆ ที่ประมาณ 100 มิลลิวินาทีว่าเป็นเกณฑ์ความล่าช้าของอินพุตสำหรับ Web Vitals ที่เหมาะสม นอกจากนี้ การที่ผู้ใช้รายงานว่าระดับคุณภาพต่ำมีความล่าช้าตั้งแต่ 300 มิลลิวินาทีขึ้นไป ถือว่า 300 มิลลิวินาทีถือเป็นเกณฑ์ที่ "แย่" พอสมควร

ความสำเร็จ

เมื่อใช้ข้อมูลจาก CrUX เราจะพิจารณาว่าต้นทางส่วนใหญ่บนเว็บเป็นไปตามเกณฑ์ "ดี" ของ FID ที่ 100 มิลลิวินาทีที่เปอร์เซ็นไทล์ที่ 75 ดังนี้

% ของต้นทาง CrUX ที่จัดประเภทเป็น "ดี" สำหรับเกณฑ์ FID ที่ 100 มิลลิวินาที

100 มิลลิวินาที
phone 78%
เดสก์ท็อป >99%

นอกจากนี้ เราสังเกตเห็นว่าเว็บไซต์ยอดนิยมต่างๆ ทั่วทั้งอินเทอร์เน็ตสามารถผ่านเกณฑ์นี้อย่างสม่ำเสมอที่เปอร์เซ็นไทล์ที่ 75 (และมักจะเป็นไปตามเกณฑ์ที่เปอร์เซ็นไทล์ที่ 95)

จากข้อมูลทั้งหมดข้างต้น เราสรุปว่า 100 มิลลิวินาทีเป็นเกณฑ์ "ดี" ที่สมเหตุสมผลสำหรับ FID

การเปลี่ยนเลย์เอาต์สะสม

คุณภาพของประสบการณ์

Cumulative Layout Shift (CLS) เป็นเมตริกใหม่ที่วัดว่าเนื้อหาที่มองเห็นได้ในหน้าเว็บมีการเปลี่ยนแปลงมากน้อยเพียงใด เนื่องจาก CLS เป็นเรื่องใหม่ เราจึงไม่ทราบการวิจัยที่สามารถแจ้งเกณฑ์สำหรับเมตริกนี้ได้โดยตรง ดังนั้น เพื่อระบุเกณฑ์ที่สอดคล้องกับความคาดหวังของผู้ใช้ เราจึงประเมินหน้าเว็บในชีวิตจริงที่มีปริมาณการเปลี่ยนเลย์เอาต์แตกต่างกัน เพื่อระบุจํานวนการเปลี่ยนแปลงสูงสุดที่รับรู้ได้ก่อนทําให้เกิดการหยุดชะงักอย่างมากเมื่อใช้เนื้อหาในหน้าเว็บ ในการทดสอบภายใน เราพบว่าระดับการเปลี่ยนแปลงจาก 0.15 ขึ้นไปถือว่าเป็นการรบกวนอย่างต่อเนื่อง ขณะที่การเปลี่ยนแปลงของ 0.1 หรือต่ำกว่านั้นสังเกตเห็นได้ชัดเจนแต่ไม่ได้รบกวนมากเกินไป ดังนั้น แม้การเปลี่ยนเลย์เอาต์เป็น 0 จะเหมาะสมที่สุด เราก็สรุปว่าค่าไม่เกิน 0.1 เป็นเกณฑ์ CLS ที่ "ดี"

ความสำเร็จ

จากข้อมูลของ CrUX เราพบว่าต้นทางเกือบ 50% มี CLS เท่ากับ 0.05 หรือต่ำกว่า

% ของต้นทาง CrUX ที่จัดประเภทเป็น "ดี" (สำหรับเกณฑ์ CLS ของผู้สมัคร)

  0.05 0.1 15
phone 49% 60% 69%
เดสก์ท็อป 42% 59% 69%

แม้ว่าข้อมูล CrUX ชี้ว่า 0.05 อาจเป็นเกณฑ์ CLS ที่ "ดี" ที่สมเหตุสมผล แต่เราตระหนักดีว่ามีกรณีการใช้งานบางอย่างที่ขัดขวางการเปลี่ยนแปลงเลย์เอาต์ที่รบกวนผู้ใช้ในปัจจุบัน ตัวอย่างเช่น สำหรับเนื้อหาที่ฝังของบุคคลที่สาม เช่น การฝังโซเชียลมีเดีย บางครั้งระบบไม่ทราบความสูงของเนื้อหาที่ฝังจนกว่าจะโหลดเสร็จ ซึ่งอาจนำไปสู่การเปลี่ยนเลย์เอาต์มากกว่า 0.05 ดังนั้น เราจึงสรุปว่า ขณะที่ต้นทางหลายแห่งเป็นไปตามเกณฑ์ 0.05 แต่เกณฑ์ CLS ที่เข้มงวดน้อยกว่าเล็กน้อยอยู่ที่ 0.1 สร้างสมดุลที่ดีกว่าระหว่างคุณภาพของประสบการณ์กับประสบการณ์ เราหวังว่านับจากนี้ไป ระบบนิเวศของเว็บจะระบุโซลูชันเพื่อจัดการกับการเปลี่ยนเลย์เอาต์ที่เกิดจากการฝังของบุคคลที่สาม ซึ่งอาจทำให้ใช้เกณฑ์ "ดี" ของ CLS ที่ "ดี" ในระดับ 0.05 หรือ 0 ได้ในอนาคตสำหรับ Core Web Vitals

นอกจากนี้ ในการพิจารณาเกณฑ์ "ต่ำ" สำหรับ CLS เราใช้ข้อมูล CrUX ในการระบุเกณฑ์ที่ต้นทางส่วนใหญ่เป็นไปตามเกณฑ์ต่อไปนี้

% ของต้นทาง CrUX ที่จัดเป็นประเภท "ช้า" (สำหรับเกณฑ์ CLS ของผู้สมัคร)

  15 0.2 0.25 0.3
phone 31% 25% 20% 18%
เดสก์ท็อป 31% 23% 18% 16%

สำหรับเกณฑ์ 0.25 ซึ่งประมาณ 20% ของต้นทางของโทรศัพท์และ 18% ของต้นทางบนเดสก์ท็อป จะได้รับการจัดประเภทเป็น "ช้า" ซึ่งอยู่ในช่วงเป้าหมาย 10-30% เราจึงสรุปว่า 0.25 เป็นเกณฑ์ที่ "แย่" ที่ยอมรับได้