การวิจัยและระเบียบวิธีการใช้งานเกณฑ์ Core Web Vitals
เผยแพร่: 21 พฤษภาคม 2020
Core Web Vitals คือชุดเมตริกภาคสนามที่วัดแง่มุมสําคัญของประสบการณ์ของผู้ใช้จริงบนเว็บ Core Web Vitals มีเมตริกและเกณฑ์เป้าหมายสำหรับเมตริกแต่ละรายการ ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์เข้าใจว่าประสบการณ์การใช้งานเว็บไซต์ของตน "ดี" "ต้องปรับปรุง" หรือ "ไม่ดี" โพสต์นี้จะอธิบายแนวทางที่ใช้เลือกเกณฑ์สําหรับเมตริก Core Web Vitals โดยทั่วไป รวมถึงวิธีเลือกเกณฑ์สําหรับเมตริก Core Web Vitals แต่ละรายการ
ข้อมูลเบื้องต้น: เมตริกและเกณฑ์ของ Core Web Vitals
Core Web Vitals คือเมตริก 3 รายการ ได้แก่ Largest Contentful Paint (LCP), Interaction to Next Paint (INP) และ Cumulative Layout Shift (CLS) เมตริกแต่ละรายการจะวัดแง่มุมที่แตกต่างกันของประสบการณ์ของผู้ใช้ โดย LCP จะวัดความเร็วในการโหลดที่รับรู้ได้และระบุจุดในไทม์ไลน์การโหลดหน้าเว็บเมื่อเนื้อหาหลักของหน้าเว็บมีแนวโน้มที่จะโหลด INP จะวัดการตอบสนองและระบุปริมาณประสบการณ์ที่ผู้ใช้ได้รับเมื่อพยายามโต้ตอบกับหน้าเว็บ และ CLS จะวัดความเสถียรของภาพและระบุปริมาณการเปลี่ยนแปลงเลย์เอาต์ที่ไม่คาดคิดของเนื้อหาหน้าเว็บที่มองเห็นได้
เมตริก Core Web Vitals แต่ละรายการมีเกณฑ์ที่เกี่ยวข้อง ซึ่งจะจัดหมวดหมู่ประสิทธิภาพเป็น "ดี" "ต้องปรับปรุง" หรือ "แย่" ดังนี้
ดี | แย่ | เปอร์เซ็นไทล์ | |
---|---|---|---|
การแสดงผลเนื้อหาขนาดใหญ่ที่สุด | ≤2500 มิลลิวินาที | >4000 มิลลิวินาที | 75 |
การโต้ตอบกับ Next Paint | ≤200 มิลลิวินาที | >500 มิลลิวินาที | 75 |
การเปลี่ยนเลย์เอาต์สะสม | ≤0.1 | > 0.25 | 75 |
นอกจากนี้ เรายังใช้ค่าเปอร์เซ็นต์ไทล์ 75 ของการดูหน้าเว็บทั้งหมดในหน้าเว็บหรือเว็บไซต์นั้นๆ เพื่อจัดประเภทประสิทธิภาพโดยรวมของหน้าเว็บหรือเว็บไซต์ กล่าวคือ หากการดูหน้าเว็บอย่างน้อย 75 เปอร์เซ็นต์ในเว็บไซต์ผ่านเกณฑ์ "ดี" เว็บไซต์จะได้รับการจัดประเภทว่ามีประสิทธิภาพ "ดี" สำหรับเมตริกนั้น ในทางกลับกัน หากการดูหน้าเว็บอย่างน้อย 25 เปอร์เซ็นต์มีคุณสมบัติตรงตามเกณฑ์ "แย่" ระบบจะจัดประเภทเว็บไซต์ดังกล่าวว่ามีประสิทธิภาพ "แย่" ตัวอย่างเช่น LCP เปอร์เซ็นไทล์ที่ 75 ที่ 2 วินาทีจะได้รับการจัดประเภทเป็น "ดี" ขณะที่ LCP เปอร์เซ็นไทล์ที่ 75 ที่ 5 วินาทีจะจัดเป็น "แย่"
เกณฑ์สำหรับเกณฑ์เมตริก Core Web Vitals
ในส่วนนี้ เราจะมาดูเกณฑ์ในการประเมินเกณฑ์เมตริก Core Web Vitals ส่วนต่อๆ ไปจะอธิบายรายละเอียดเพิ่มเติมเกี่ยวกับการใช้เกณฑ์เหล่านี้เพื่อเลือกเกณฑ์สำหรับเมตริกแต่ละรายการ ในปีต่อๆ ไป เราคาดว่าจะปรับปรุงและเพิ่มเกณฑ์และเกณฑ์เพื่อปรับปรุงความสามารถในการวัดประสบการณ์การใช้งานที่ยอดเยี่ยมบนเว็บให้ดียิ่งขึ้น
ประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง
เป้าหมายหลักของเราคือการเพิ่มประสิทธิภาพเพื่อผู้ใช้และคุณภาพของประสบการณ์การใช้งาน ด้วยเหตุนี้ เรามุ่งหวังที่จะตรวจสอบว่าหน้าเว็บเป็นไปตามเกณฑ์ "ดี" ของ Core Web Vitals จะมอบประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง
เราพิจารณาการรับรู้ของมนุษย์และการวิจัย HCI เพื่อระบุเกณฑ์ที่เกี่ยวข้องกับประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง แม้ว่าบางครั้งจะมีการสรุปการวิจัยนี้โดยใช้เกณฑ์คงที่เพียงเกณฑ์เดียว แต่เราพบว่าการวิจัยที่เกี่ยวข้องมักจะแสดงเป็นช่วงของค่า ตัวอย่างเช่น บางครั้งการวิจัยเกี่ยวกับระยะเวลาที่ผู้ใช้มักจะรอก่อนที่จะเสียสมาธิจะอธิบายเป็น 1 วินาที แต่การวิจัยที่เกี่ยวข้องจะแสดงเป็นช่วงตั้งแต่หลายร้อยมิลลิวินาทีไปจนถึงหลายวินาที ความจริงที่ว่าเกณฑ์การรับรู้นั้นแตกต่างกันไปโดยขึ้นอยู่กับผู้ใช้และบริบทได้รับการสนับสนุนเพิ่มเติมจากข้อมูลเมตริก Chrome ที่รวบรวมและลบข้อมูลระบุตัวบุคคลออก ซึ่งแสดงให้เห็นว่าไม่มีระยะเวลาที่แน่นอนที่ผู้ใช้รอให้หน้าเว็บแสดงเนื้อหาก่อนที่จะยกเลิกการโหลดหน้าเว็บ แต่ข้อมูลนี้จะแสดงการกระจายที่ราบรื่นและต่อเนื่อง ดูข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับเกณฑ์การรับรู้ของมนุษย์และการวิจัย HCI ที่เกี่ยวข้องได้ที่วิทยาศาสตร์เบื้องหลัง WebVitals
ในกรณีที่มีงานวิจัยเกี่ยวกับประสบการณ์ของผู้ใช้ที่เกี่ยวข้องสําหรับเมตริกหนึ่งๆ และมีความเห็นพ้องกันในระดับหนึ่งเกี่ยวกับช่วงของค่าในเอกสาร เราจะใช้ช่วงนี้เป็นข้อมูลในการแนะนํากระบวนการเลือกเกณฑ์ ในกรณีที่ไม่มีงานวิจัยเกี่ยวกับประสบการณ์ของผู้ใช้ที่เกี่ยวข้อง เช่น สําหรับเมตริกใหม่ เช่น การเปลี่ยนแปลงเลย์เอาต์แบบสะสม เราจะประเมินหน้าเว็บในชีวิตจริงที่ตรงตามเกณฑ์ต่างๆ ที่เป็นไปได้สําหรับเมตริกแทน เพื่อระบุเกณฑ์ที่ส่งผลให้ผู้ใช้ได้รับประสบการณ์การใช้งานที่ดี
ประสบความสำเร็จได้ด้วยเนื้อหาเว็บที่มีอยู่
นอกจากนี้ เรากำหนดให้เนื้อหาที่มีอยู่บนเว็บต้องเป็นไปตามเกณฑ์เหล่านี้เพื่อให้เจ้าของเว็บไซต์เพิ่มประสิทธิภาพเว็บไซต์ให้บรรลุเกณฑ์ "ดี" ได้ ตัวอย่างเช่น แม้ว่า 0 มิลลิวินาทีจะเป็นเกณฑ์ "ดี" ของ LCP ที่เหมาะสม ซึ่งส่งผลให้ประสบการณ์การโหลดทันที แต่เกณฑ์ 0 มิลลิวินาทีอาจไม่บรรลุผลในทางปฏิบัติในกรณีส่วนใหญ่ เนื่องจากเวลาในการตอบสนองในการประมวลผลเครือข่ายและอุปกรณ์ ดังนั้น 0 มิลลิวินาทีจึงไม่ใช่เกณฑ์ "ดี" ที่สมเหตุสมผลของ LCP สําหรับ Core Web Vitals
เมื่อประเมินเกณฑ์ "ดี" ของ Core Web Vitals ที่จะได้รับการรับรอง เราจะยืนยันว่าเกณฑ์เหล่านั้นทำได้จริง โดยอิงตามข้อมูลจากรายงานประสบการณ์ของผู้ใช้ Chrome (CrUX) เราต้องการตรวจสอบว่าเกณฑ์นั้นทำได้จริง โดยกำหนดให้ต้นทางอย่างน้อย 10% มีคุณสมบัติตรงตามเกณฑ์ "ดี" นอกจากนี้ เรายังตรวจสอบว่าเนื้อหาที่ได้รับการเพิ่มประสิทธิภาพอย่างดีมีคุณสมบัติตรงตามเกณฑ์ "ดี" เสมอ เพื่อให้มั่นใจว่าเว็บไซต์ที่ได้รับการเพิ่มประสิทธิภาพอย่างดีจะไม่ได้รับการจัดประเภทไม่ถูกต้องเนื่องจากความแปรปรวนของข้อมูลภาคสนาม
ในทางกลับกัน เราจะกำหนดเกณฑ์ "แย่" โดยระบุระดับประสิทธิภาพที่แหล่งที่มาเพียงส่วนน้อยเท่านั้นที่ไม่เป็นไปตามเกณฑ์ เว้นแต่จะมีงานวิจัยที่เกี่ยวข้องกับการกำหนดเกณฑ์ "แย่" โดยค่าเริ่มต้น ระบบจะจัดประเภทต้นทางที่มีประสิทธิภาพแย่ที่สุด 10-30% เป็น "แย่"
กำหนดเกณฑ์เดียวกันหรือต่างกันในแต่ละอุปกรณ์
โดยทั่วไป การใช้งานบนอุปกรณ์เคลื่อนที่และเดสก์ท็อปมีลักษณะที่แตกต่างกันมากในแง่ความสามารถของอุปกรณ์และความน่าเชื่อถือของเครือข่าย ข้อมูลนี้ส่งผลต่อเกณฑ์ "ความเป็นไปได้" อย่างมาก เราจึงควรพิจารณาเกณฑ์แยกกันสำหรับแต่ละรายการ
อย่างไรก็ตาม ความคาดหวังของผู้ใช้เกี่ยวกับประสบการณ์ที่ดีหรือไม่ดีนั้นไม่ได้ขึ้นอยู่กับอุปกรณ์ แม้ว่าเกณฑ์การบรรลุเป้าหมายจะขึ้นอยู่กับอุปกรณ์ก็ตาม ด้วยเหตุนี้ เกณฑ์ที่แนะนำของ Core Web Vitals จึงไม่ได้แยกตามอุปกรณ์และใช้เกณฑ์เดียวกันสำหรับทั้ง 2 อุปกรณ์ ซึ่งยังมีข้อดีเพิ่มเติมอีกอย่างหนึ่งคือทำให้เข้าใจเกณฑ์ได้ง่ายขึ้น
นอกจากนี้ อุปกรณ์อาจไม่เหมาะกับหมวดหมู่ใดหมวดหมู่หนึ่งเสมอไป โดยจะขึ้นอยู่กับรูปแบบของอุปกรณ์ พลังในการประมวลผล หรือสภาพของเครือข่าย การมีเกณฑ์เดียวกันมีข้อดีเพิ่มเติมในการหลีกเลี่ยงความซับซ้อนดังกล่าว
ยิ่งอุปกรณ์เคลื่อนที่มีข้อจำกัดมากขึ้น นั่นหมายความว่าเกณฑ์ส่วนใหญ่จะกำหนดตามความสามารถในการใช้งานบนอุปกรณ์เคลื่อนที่ ข้อมูลเหล่านี้มีแนวโน้มที่จะแสดงเกณฑ์ของอุปกรณ์เคลื่อนที่มากกว่าเกณฑ์ร่วมจริงในอุปกรณ์ทุกประเภท อย่างไรก็ตาม เนื่องจากอุปกรณ์เคลื่อนที่มักเป็นแหล่งที่มาของการเข้าชมส่วนใหญ่สําหรับเว็บไซต์ส่วนใหญ่ คุณจึงไม่ต้องกังวลมากนัก
ความคิดเห็นสุดท้ายเกี่ยวกับเกณฑ์
เมื่อประเมินเกณฑ์ผู้สมัคร เราพบว่าบางครั้งเกณฑ์ก็ขัดแย้งกัน ตัวอย่างเช่น อาจมีความขัดแย้งระหว่างเกณฑ์ที่ทำได้อย่างต่อเนื่องกับการช่วยให้ผู้ใช้ได้รับประสบการณ์ที่ดีอย่างต่อเนื่อง นอกจากนี้ เนื่องจากการวิจัยการรับรู้ของมนุษย์มักให้ค่าที่หลากหลาย และเมตริกพฤติกรรมของผู้ใช้จะแสดงพฤติกรรมที่เปลี่ยนไปทีละน้อย เราจึงพบว่าเมตริกหนึ่งๆ มักไม่มีเกณฑ์ที่ "ถูกต้อง" เพียงเกณฑ์เดียว ดังนั้น แนวทางของเราสําหรับ Core Web Vitals คือการเลือกเกณฑ์ที่ตรงกับเกณฑ์มากที่สุด ขณะเดียวกันก็ตระหนักดีว่าไม่มีเกณฑ์ใดที่สมบูรณ์แบบ และบางครั้งเราอาจต้องเลือกจากเกณฑ์ที่เหมาะสมหลายเกณฑ์ แทนที่จะถามว่า "เกณฑ์ที่เหมาะที่สุดคืออะไร" เรามุ่งเน้นที่การถามว่า "เกณฑ์ผู้สมัครใดบรรลุเกณฑ์ของเราได้ดีที่สุด"
ตัวเลือกเปอร์เซ็นไทล์
ดังที่กล่าวไว้ก่อนหน้านี้ เราใช้ค่าเปอร์เซ็นไทล์ที่ 75 ของการเข้าชมทั้งหมดในหน้าเว็บหรือเว็บไซต์นั้นๆ เพื่อจัดประเภทประสิทธิภาพโดยรวมของหน้าเว็บหรือเว็บไซต์ เราเลือกเปอร์เซ็นต์ที่ 75 ตามเกณฑ์ 2 ข้อ อันดับแรกเปอร์เซ็นไทล์ควรตรวจสอบให้แน่ใจว่าการเข้าชมส่วนใหญ่ในหน้าเว็บหรือเว็บไซต์พบประสิทธิภาพในระดับเป้าหมาย ประการที่ 2 ค่าที่เปอร์เซ็นต์ไทล์ที่เลือกไม่ควรได้รับผลกระทบจากค่าผิดปกติมากเกินไป
เป้าหมายเหล่านี้ขัดแย้งกันอยู่บ้าง หากต้องการบรรลุเป้าหมายแรก เปอร์เซ็นต์ไทล์ที่สูงขึ้นมักจะเป็นตัวเลือกที่ดีกว่า อย่างไรก็ตาม เมื่อเปอร์เซ็นต์ไทล์สูงขึ้น โอกาสที่ค่าที่ได้จะได้รับผลกระทบจากค่าผิดปกติก็จะเพิ่มขึ้นด้วย หากการเข้าชมเว็บไซต์ 2-3 ครั้งเกิดขึ้นจากการเชื่อมต่อเครือข่ายที่ไม่เสถียรซึ่งส่งผลให้ตัวอย่าง LCP มีขนาดมากเกินไป เราไม่ต้องการให้การแบ่งประเภทเว็บไซต์ของเราขึ้นอยู่กับตัวอย่างที่ผิดปกติเหล่านี้ ตัวอย่างเช่น หากเราประเมินประสิทธิภาพของเว็บไซต์ที่มีการเข้าชม 100 ครั้งโดยใช้เปอร์เซ็นต์ส่วนสูง เช่น เปอร์เซ็นต์ส่วน 95 ก็จะมีเพียงตัวอย่างค่าเบี่ยงเบน 5 รายการเท่านั้นที่ทําให้ค่าเปอร์เซ็นต์ส่วน 95 ได้รับผลกระทบจากค่าเบี่ยงเบน
เนื่องจากเป้าหมายเหล่านี้ขัดแย้งกันเล็กน้อย หลังจากการวิเคราะห์ เราจึงสรุปว่าเปอร์เซ็นต์ไทล์ที่ 75 มีความสมดุลที่เหมาะสม เมื่อใช้เปอร์เซ็นต์ไทล์ที่ 75 เราพบว่าการเข้าชมเว็บไซต์ส่วนใหญ่ (3 ใน 4 รายการ) มีประสิทธิภาพในระดับเป้าหมายหรือดีกว่า นอกจากนี้ ค่าเปอร์เซ็นไทล์ที่ 75 ยังมีโอกาสน้อยที่จะได้รับผลกระทบจากค่าที่ผิดปกติ กลับมาที่ตัวอย่างของเรา สำหรับเว็บไซต์ที่มีการเข้าชม 100 ครั้ง การเข้าชม 25 ครั้งในจำนวนดังกล่าวจะต้องรายงานตัวอย่างค่าผิดปกติจำนวนมากสำหรับค่าที่เปอร์เซ็นไทล์ที่ 75 ซึ่งจะได้รับผลกระทบจากค่าผิดปกติ แม้ว่าตัวอย่าง 25 จาก 100 รายการจะเป็นค่าผิดปกติได้ แต่ก็มีโอกาสน้อยกว่ากรณีเปอร์เซ็นไทล์ที่ 95
การแสดงผลเนื้อหาขนาดใหญ่ที่สุด
เกณฑ์ LCP ได้รับการกําหนดโดยพิจารณาจากคุณภาพของประสบการณ์และความสามารถในการบรรลุเป้าหมายต่อไปนี้
คุณภาพของประสบการณ์
1 วินาทีมักใช้เป็นระยะเวลาที่ผู้ใช้จะรอก่อนที่จะเริ่มเสียสมาธิกับงาน จากการตรวจสอบการวิจัยที่เกี่ยวข้องอย่างละเอียด เราพบว่า 1 วินาทีเป็นค่าโดยประมาณที่อธิบายช่วงของค่าต่างๆ ตั้งแต่ประมาณหลายร้อยมิลลิวินาทีไปจนถึงหลายวินาที
แหล่งที่มา 2 แหล่งที่อ้างอิงกันโดยทั่วไปสำหรับเกณฑ์ 1 วินาทีคือ Card และอื่นๆ และ Miller Card กําหนดเกณฑ์ "การตอบกลับทันที" 1 วินาที โดยอ้างอิงจากทฤษฎีการรับรู้แบบรวมของ Newell Newell อธิบายการตอบสนองทันทีว่า "การตอบสนองที่ต้องทำต่อสิ่งเร้าบางอย่างภายในประมาณ 1 วินาที (นั่นคือประมาณ 0.3-3 วินาที)" กระบวนการนี้เป็นไปตามการพูดคุยเรื่อง "ข้อจำกัดแบบเรียลไทม์ในการรับรู้" ของ Newell ที่กล่าวว่า "การโต้ตอบกับสิ่งแวดล้อมที่กระตุ้นให้เกิดการพิจารณาการรับรู้ตามลำดับวินาที" ซึ่งมีตั้งแต่ประมาณ 0.5 ถึง 2-3 วินาที Miller ซึ่งเป็นแหล่งข้อมูลอีกแหล่งหนึ่งที่มักอ้างอิงถึงเกณฑ์ 1 วินาที ระบุว่า "งานซึ่งมนุษย์สามารถทำได้และจะทำด้วยการสื่อสารด้วยเครื่องจักรจะเปลี่ยนแปลงลักษณะการทำงานอย่างรุนแรงหากความล่าช้าในการตอบกลับนานกว่า 2 วินาที และอาจนานกว่านั้นอีก 1 วินาทีหรือประมาณนั้น"
งานวิจัยของ Miller และ Card อธิบายระยะเวลาที่ผู้ใช้จะรอก่อนที่จะเสียสมาธิเป็นช่วงๆ ตั้งแต่ประมาณ 0.3 ถึง 3 วินาที ซึ่งบ่งชี้ว่าเกณฑ์ LCP "ดี" ควรอยู่ในช่วงนี้ นอกจากนี้ เนื่องจากเกณฑ์ "ดี" ของ First Contentful Paint ที่มีอยู่คือ 1 วินาที และ Largest Contentful Paint มักเกิดขึ้นหลังจาก First Contentful Paint ทำให้เราจำกัดช่วงเกณฑ์ LCP ของตัวเลือกเริ่มจาก 1 วินาทีถึง 3 วินาที ในการเลือกเกณฑ์ในช่วงนี้ซึ่งตรงกับเกณฑ์มากที่สุด เราจะดูที่ความสามารถในการบรรลุเกณฑ์ของผู้สมัครเหล่านี้เป็นลำดับถัดไป
ความสามารถในการบรรลุเป้าหมาย
เมื่อใช้ข้อมูลจาก CrUX เราจะระบุเปอร์เซ็นต์ของต้นทางในเว็บที่มีคุณสมบัติตรงตามเกณฑ์ "ดี" ของ LCP ที่เป็นไปได้
1 วินาที | 1.5 วินาที | 2 วินาที | 2.5 วินาที | 3 วินาที | |
---|---|---|---|---|---|
phone | 3.5% | 13% | 27% | 42% | 55% |
เดสก์ท็อป | 6.9% | 19% | 36% | 51% | 64% |
แม้ว่าต้นทางไม่ถึง 10% จะเป็นไปตามเกณฑ์ 1 วินาที แต่เกณฑ์อื่นๆ ทั้งหมดตั้งแต่ 1.5 ถึง 3 วินาทีเป็นไปตามข้อกำหนดของเราที่ว่าต้นทางอย่างน้อย 10% ต้องเป็นไปตามเกณฑ์ "ดี" จึงยังคงเป็นตัวเลือกที่ถูกต้อง
นอกจากนี้ เรายังวิเคราะห์ประสิทธิภาพ LCP สําหรับเว็บไซต์ที่มีประสิทธิภาพสูงสุดในเว็บเพื่อพิจารณาเกณฑ์ที่เว็บไซต์เหล่านี้ทำได้อย่างต่อเนื่อง เพื่อให้มั่นใจว่าเกณฑ์ที่เลือกไว้จะบรรลุได้อย่างต่อเนื่องสําหรับเว็บไซต์ที่ได้รับการเพิ่มประสิทธิภาพอย่างดี กล่าวโดยละเอียดคือ เราต้องการระบุเกณฑ์ที่ทำได้อย่างต่อเนื่องที่เปอร์เซ็นต์ไทล์ 75 สำหรับเว็บไซต์ที่มีประสิทธิภาพสูงสุด เราพบว่าเกณฑ์ 1.5 และ 2 วินาทีนั้นทำได้ไม่สม่ำเสมอ แต่เกณฑ์ 2.5 วินาทีทำได้สม่ำเสมอ
ในการระบุเกณฑ์ที่ "แย่" สำหรับ LCP เราใช้ข้อมูล CrUX ในการระบุเกณฑ์ที่ต้นทางส่วนใหญ่ตรงตามเกณฑ์ ดังนี้
3 วินาที | 3.5 วินาที | 4 วินาที | 4.5 วินาที | 5 วินาที | |
---|---|---|---|---|---|
phone | 45% | 35% | 26% | 20% | 15% |
desktop | 36% | 26% | 19% | 14% | 10% |
สำหรับเกณฑ์ 4 วินาที ต้นทางจากโทรศัพท์ประมาณ 26% และต้นทางจากเดสก์ท็อปประมาณ 21% จะจัดอยู่ในระดับ "แย่" ซึ่งอยู่ในช่วงเป้าหมาย 10-30% เราจึงสรุปได้ว่า 4 วินาทีเป็นเกณฑ์ "ไม่ดี" ที่ยอมรับได้
เราจึงสรุปได้ว่า 2.5 วินาทีเป็นเกณฑ์ "ดี" ที่สมเหตุสมผล และ 4 วินาทีเป็นเกณฑ์ "แย่" ที่สมเหตุสมผลสำหรับการแสดงผลเนื้อหาขนาดใหญ่ที่สุด (LCP)
การโต้ตอบกับ Next Paint
เกณฑ์ INP ได้รับการกําหนดโดยพิจารณาจากคุณภาพของประสบการณ์และความสามารถในการบรรลุเป้าหมายต่อไปนี้
คุณภาพของประสบการณ์
การวิจัยมีความสอดคล้องกันพอสมควรในการสรุปว่าความล่าช้าของการแสดงผลภาพสูงสุดประมาณ 100 มิลลิวินาทีนั้นเกิดจากแหล่งที่มาที่เกี่ยวข้อง เช่น อินพุตของผู้ใช้ ซึ่งหมายความว่าเกณฑ์ "ดี" ของการโต้ตอบกับ Next Paint ที่เหมาะควรควรอยู่ใกล้กับค่านี้
บทความเวลาในการตอบสนอง: ขีดจํากัดที่สําคัญ 3 ข้อของ Jakob Nielsen ที่มักมีการอ้างอิงจะกําหนดให้ 0.1 วินาทีเป็นขีดจํากัดเพื่อให้ผู้ใช้รู้สึกว่าระบบตอบสนองทันที Nielsen อ้างอิง Miller และ Card ซึ่งอ้างอิงจากบทความการรับรู้ถึงสาเหตุของ Michotte ในปี 1962 ในการศึกษาของ Michotte ผู้เข้าร่วมการทดสอบจะเห็น "วัตถุ 2 รายการบนหน้าจอ ออบเจ็กต์ ก เริ่มออกเดินทางและมุ่งหน้าไปยัง ข มันจะหยุดเมื่อสัมผัสกับ B ส่วน B จะเริ่มทำงานและเคลื่อนออกจาก A" Michotte เปลี่ยนช่วงเวลาระหว่างที่วัตถุ ก หยุดลงและวัตถุ ข เริ่มเคลื่อนไหว Michotte พบว่าหากเกิดความล่าช้าประมาณ 100 มิลลิวินาที ผู้เข้าร่วมจะพบว่าวัตถุ A ทำให้เกิดการเคลื่อนไหวของวัตถุ B สำหรับความล่าช้าตั้งแต่ประมาณ 100-200 มิลลิวินาที การรับรู้ถึงความสัมพันธ์เชิงสาเหตุจะผสมปนกัน และสำหรับความล่าช้ามากกว่า 200 มิลลิวินาที ระบบจะไม่ถือว่าการเคลื่อนไหวของวัตถุ ข. เกิดจากวัตถุ ก. อีกต่อไป
ในทำนองเดียวกัน Miller ได้กำหนดเกณฑ์การตอบสนองสำหรับ "การตอบสนองต่อการเปิดใช้งานการควบคุม" ว่า "การบ่งชี้การดําเนินการซึ่งโดยปกติแล้วเกิดจากการขยับของปุ่ม สวิตช์ หรือส่วนควบคุมอื่นๆ ที่ส่งสัญญาณว่ามีการดําเนินการจริง การตอบสนองนี้ควร…รับรู้เป็นส่วนหนึ่งของการดําเนินการเชิงกลที่เกิดจากผู้ดําเนินการ เวลาหน่วง: ไม่เกิน 0.1 วินาที" และต่อมา "เวลาหน่วงระหว่างการกดแป้นกับการแสดงผลภาพไม่ควรเกิน 0.1 ถึง 0.2 วินาที"
เมื่อเร็วๆ นี้ ในบทความก้าวสู่ปุ่มเสมือนที่สมบูรณ์แบบตามเวลา Kaaresoja และคนอื่นๆ ได้ตรวจสอบการรับรู้ถึงความพร้อมกันระหว่างการสัมผัสปุ่มเสมือนบนหน้าจอสัมผัสกับการแสดงผลภาพต่อๆ มาซึ่งบ่งบอกว่ามีการสัมผัสปุ่มนั้นๆ สำหรับความล่าช้าต่างๆ เมื่อความล่าช้าระหว่างการกดปุ่มกับการแสดงผลภาพมีระยะเวลาไม่เกิน 85 มิลลิวินาที ผู้เข้าร่วมรายงานว่าการแสดงผลภาพปรากฏขึ้นพร้อมกันกับการกดปุ่ม 75% ของเวลา นอกจากนี้ สำหรับการหน่วงเวลา 100 มิลลิวินาทีหรือน้อยกว่า ผู้เข้าร่วมรายงานว่าคุณภาพการกดปุ่มที่รับรู้นั้นสูงอย่างต่อเนื่อง โดยคุณภาพที่รับรู้จะลดลงเมื่อการหน่วงเวลาอยู่ที่ 100-150 มิลลิวินาที และลดลงถึงระดับต่ำมากเมื่อการหน่วงเวลาอยู่ที่ 300 มิลลิวินาที
จากข้อมูลนี้ เราสรุปได้ว่างานวิจัยชี้ว่า 100 มิลลิวินาทีเป็นเกณฑ์ "ดี" ของการโต้ตอบกับ Next Paint สำหรับ Web Vitals นอกจากนี้ ผู้ใช้รายงานระดับคุณภาพต่ำเมื่อเกิดความล่าช้า 300 มิลลิวินาทีขึ้นไป ซึ่งควรเป็นเกณฑ์ "แย่"
ความสามารถในการบรรลุเป้าหมาย
เมื่อใช้ข้อมูลจาก CrUX เราพบว่าต้นทางส่วนใหญ่ในเว็บมีคุณสมบัติตรงตามเกณฑ์ "ดี" ของ INP 200 มิลลิวินาทีที่เปอร์เซ็นต์ไทล์ 75 ดังนี้
100 มิลลิวินาที | 200 มิลลิวินาที | 300 มิลลิวินาที | 400 มิลลิวินาที | 500 มิลลิวินาที | |
---|---|---|---|---|---|
phone | 12% | 56% | 76% | 88% | 92% |
desktop | 83% | 96% | 98% | 99% | 99% |
นอกจากนี้ เรายังใส่ใจเป็นพิเศษเพื่อดูความสามารถในการส่ง INP สำหรับอุปกรณ์เคลื่อนที่ระดับล่าง ซึ่งอุปกรณ์เคลื่อนที่เหล่านั้นมีสัดส่วนการเข้าชมเว็บไซต์สูง ซึ่งยืนยันความเหมาะสมของเกณฑ์ 200 มิลลิวินาทีเพิ่มเติม
เมื่อพิจารณาถึงเกณฑ์ 100 มิลลิวินาทีที่สนับสนุนโดยงานวิจัยเกี่ยวกับคุณภาพของประสบการณ์และเกณฑ์การบรรลุเป้าหมาย เราสรุปได้ว่า 200 มิลลิวินาทีเป็นเกณฑ์ที่เหมาะสมสําหรับประสบการณ์ที่ดี
เราใช้ข้อมูล CrUX เพื่อระบุเกณฑ์ "แย่" สําหรับ LCP โดยพิจารณาจากเกณฑ์ที่แหล่งที่มาส่วนใหญ่มีคุณสมบัติตรงตามเกณฑ์ต่อไปนี้
100 มิลลิวินาที | 200 มิลลิวินาที | 300 มิลลิวินาที | 400 มิลลิวินาที | 500 มิลลิวินาที | |
---|---|---|---|---|---|
phone | 88% | 44% | 24% | 12% | 8% |
desktop | 17% | 4% | 2% | 1% | 1% |
ซึ่งแสดงให้เห็นว่าเรามีเกณฑ์ "แย่" อยู่ที่ 300 มิลลิวินาที
อย่างไรก็ตาม INP กลับมีความเกี่ยวข้องแบบผกผันกับความนิยม ซึ่งแตกต่างจาก LCP และ CLS กล่าวคือ เว็บไซต์ที่ได้รับความนิยมมักจะซับซ้อนกว่า จึงมีแนวโน้มที่จะมีค่า INP สูงกว่า เมื่อเราดูไซต์ยอดนิยม 10,000 ไซต์ ซึ่งเป็นความนิยมในการท่องอินเทอร์เน็ตส่วนใหญ่ เราจะเห็นภาพที่ซับซ้อนยิ่งขึ้นเกิดขึ้น:
100 มิลลิวินาที | 200 มิลลิวินาที | 300 มิลลิวินาที | 400 มิลลิวินาที | 500 มิลลิวินาที | |
---|---|---|---|---|---|
phone | 97% | 77% | 55% | 37% | 24% |
desktop | 48% | 17% | 8% | 4% | 2% |
เกณฑ์ "แย่" 300 มิลลิวินาทีในอุปกรณ์เคลื่อนที่จะจัดประเภทเว็บไซต์ยอดนิยมส่วนใหญ่เป็น "แย่" ซึ่งจะขยายเกณฑ์การบรรลุเป้าหมายของเรา ส่วนเกณฑ์ 500 มิลลิวินาทีจะเหมาะกับเว็บไซต์ประมาณ 10-30% มากกว่า นอกจากนี้ โปรดทราบว่าเกณฑ์ "ดี" ที่ 200 มิลลิวินาทีนั้นยังเข้มงวดกว่าสำหรับเว็บไซต์เหล่านี้ด้วย แต่เว็บไซต์ 23% ยังคงผ่านเกณฑ์นี้บนอุปกรณ์เคลื่อนที่ ซึ่งยังผ่านเกณฑ์อัตราการผ่านขั้นต่ำ 10%
ด้วยเหตุนี้ เราจึงสรุปว่า 200 มิลลิวินาทีเป็นเกณฑ์ "ดี" ที่สมเหตุสมผลสําหรับเว็บไซต์ส่วนใหญ่ และมากกว่า 500 มิลลิวินาทีเป็นเกณฑ์ "แย่" ที่สมเหตุสมผล
การเปลี่ยนเลย์เอาต์สะสม
เกณฑ์ CLS ได้รับการกําหนดโดยพิจารณาจากคุณภาพของประสบการณ์และความสามารถในการบรรลุเป้าหมายต่อไปนี้
คุณภาพของประสบการณ์
การเปลี่ยนเลย์เอาต์สะสม (CLS) คือเมตริกใหม่ที่วัดระดับการเปลี่ยนแปลงของเนื้อหาที่มองเห็นได้ในหน้าเว็บ เนื่องจาก CLS เป็นข้อมูลใหม่ เราจึงยังไม่ทราบเกี่ยวกับงานวิจัย ที่บอกเกณฑ์สำหรับเมตริกนี้ได้โดยตรง ดังนั้น เราจึงประเมินหน้าเว็บในชีวิตจริงที่มีการเปลี่ยนแปลงเลย์เอาต์ในปริมาณที่แตกต่างกันเพื่อระบุจำนวนการเปลี่ยนแปลงสูงสุดที่ผู้ใช้ยอมรับได้ก่อนที่จะทำให้เกิดความขัดข้องอย่างมากเมื่อบริโภคเนื้อหาในหน้าเว็บ เพื่อหาเกณฑ์ที่สอดคล้องกับความคาดหวังของผู้ใช้ ในการทดสอบภายใน เราพบว่าระดับการเปลี่ยนแปลงจาก 0.15 ขึ้นไปนั้นเป็นสิ่งที่รบกวนอยู่เสมอ ขณะที่การเปลี่ยนแปลงที่ 0.1 และต่ำกว่านั้นสังเกตได้อย่างชัดเจนว่าการเปลี่ยนแปลงไม่มากจนเกินไป ดังนั้น แม้ว่าค่าการเปลี่ยนเลย์เอาต์เป็น 0 จะเหมาะที่สุด แต่เราสรุปว่าค่าสูงสุด 0.1 เป็นเกณฑ์ CLS ที่ "ดี"
ความสามารถในการบรรลุเป้าหมาย
จากข้อมูล CrUX เราพบว่าต้นทางเกือบ 50% มี CLS เท่ากับ 0.05 หรือต่ำกว่า
0.05 | 0.1 | 0.15 | |
---|---|---|---|
phone | 49% | 60% | 69% |
desktop | 42% | 59% | 69% |
แม้ว่าข้อมูล CrUX จะระบุว่า 0.05 อาจเป็นเกณฑ์ CLS "ดี" ที่สมเหตุสมผล แต่เราก็ตระหนักดีว่าบางกรณีการใช้งานนั้นหลีกเลี่ยงการเปลี่ยนเลย์เอาต์ที่รบกวนได้ยาก ตัวอย่างเช่น สำหรับเนื้อหาที่ฝังของบุคคลที่สาม เช่น การฝังโซเชียลมีเดีย บางครั้งระบบอาจไม่ทราบความสูงของเนื้อหาที่ฝังจนกว่าระบบจะโหลดเสร็จ ซึ่งอาจทําให้เลย์เอาต์เปลี่ยนมากกว่า 0.05 เราจึงสรุปได้ว่าแม้ว่าต้นทางหลายแห่งจะเป็นไปตามเกณฑ์ 0.05 แต่เกณฑ์ CLS ที่เข้มงวดน้อยกว่าเล็กน้อยที่ 0.1 จะให้ความสมดุลที่ดีขึ้นระหว่างคุณภาพของประสบการณ์และความสามารถในการบรรลุ เราหวังว่าในอนาคตระบบนิเวศของเว็บจะระบุโซลูชันเพื่อจัดการกับการเปลี่ยนแปลงเลย์เอาต์ที่เกิดจากการฝังของบุคคลที่สาม ซึ่งจะช่วยให้ใช้เกณฑ์ "ดี" ของ CLS ที่เข้มงวดมากขึ้นที่ 0.05 หรือ 0 ใน Core Web Vitals เวอร์ชันถัดไปได้
นอกจากนี้ เราใช้ข้อมูล CrUX เพื่อระบุเกณฑ์ที่แหล่งที่มาส่วนใหญ่มีคุณสมบัติตรงตามเพื่อกำหนดเกณฑ์ "แย่" สำหรับ CLS ดังนี้
0.15 | 0.2 | 0.25 | 0.3 | |
---|---|---|---|---|
phone | 31% | 25% | 20% | 18% |
desktop | 31% | 23% | 18% | 16% |
สำหรับเกณฑ์ 0.25 แหล่งที่มาของโทรศัพท์ประมาณ 20% และแหล่งที่มาของเดสก์ท็อปประมาณ 18% จะจัดอยู่ในระดับ "แย่" ซึ่งอยู่ในช่วงเป้าหมาย 10-30% เราจึงสรุปว่า 0.25 เป็นเกณฑ์ "แย่" ที่ยอมรับได้