วิธีกำหนดเกณฑ์เมตริก Core Web Vitals

ข้อมูลวิจัยและวิธีการเบื้องหลังเกณฑ์ของ Core Web Vitals

เผยแพร่: 21 พฤษภาคม 2020

Core Web Vitals คือชุดเมตริกภาคสนามที่วัดแง่มุมที่สําคัญของประสบการณ์ของผู้ใช้ในการใช้งานจริงบนเว็บ Core Web Vitals มีเมตริกและเกณฑ์เป้าหมายสำหรับเมตริกแต่ละรายการ ซึ่งช่วยให้นักพัฒนาซอฟต์แวร์เข้าใจว่าประสบการณ์การใช้งานเว็บไซต์ของตน "ดี" "ต้องปรับปรุง" หรือ "ไม่ดี" โพสต์นี้จะอธิบายแนวทางที่ใช้เลือกเกณฑ์สําหรับเมตริก Core Web Vitals โดยทั่วไป รวมถึงวิธีเลือกเกณฑ์สําหรับเมตริก Core Web Vitals แต่ละรายการ

ข้อมูลเบื้องต้น: เมตริกและเกณฑ์ของ Core Web Vitals

Core Web Vitals คือเมตริก 3 รายการ ได้แก่ Largest Contentful Paint (LCP), Interaction to Next Paint (INP) และ Cumulative Layout Shift (CLS) เมตริกแต่ละรายการจะวัดแง่มุมที่แตกต่างกันของประสบการณ์ของผู้ใช้ โดย LCP จะวัดความเร็วในการโหลดที่รับรู้ได้และระบุจุดในไทม์ไลน์การโหลดหน้าเว็บเมื่อเนื้อหาหลักของหน้าเว็บมีแนวโน้มที่จะโหลด INP จะวัดการตอบสนองและระบุปริมาณประสบการณ์ที่ผู้ใช้ได้รับเมื่อพยายามโต้ตอบกับหน้าเว็บ และ CLS จะวัดความเสถียรของภาพและระบุปริมาณการเปลี่ยนแปลงเลย์เอาต์ที่ไม่คาดคิดของเนื้อหาหน้าเว็บที่มองเห็นได้

เมตริก Core Web Vitals แต่ละรายการมีเกณฑ์ที่เกี่ยวข้อง ซึ่งจะจัดหมวดหมู่ประสิทธิภาพเป็น "ดี" "ต้องปรับปรุง" หรือ "แย่" ดังนี้

คําแนะนําเกี่ยวกับเกณฑ์ของ Largest Contentful Paint คําแนะนําเกี่ยวกับเกณฑ์ Interaction to Next Paint คําแนะนําเกณฑ์ Cumulative Layout Shift
  ดี แย่ เปอร์เซ็นไทล์
การแสดงผลเนื้อหาขนาดใหญ่ที่สุด ≤2500 มิลลิวินาที >4000 มิลลิวินาที 75
การโต้ตอบกับ Next Paint ≤200 มิลลิวินาที > 500 มิลลิวินาที 75
การเปลี่ยนเลย์เอาต์สะสม ≤0.1 > 0.25 75
เกณฑ์ของ Core Web Vitals

นอกจากนี้ เรายังใช้ค่าเปอร์เซ็นต์ไทล์ 75 ของการดูหน้าเว็บทั้งหมดในหน้าเว็บหรือเว็บไซต์นั้นๆ เพื่อจัดประเภทประสิทธิภาพโดยรวมของหน้าเว็บหรือเว็บไซต์ กล่าวคือ หากการดูหน้าเว็บในเว็บไซต์อย่างน้อย 75 เปอร์เซ็นต์เป็นไปตามเกณฑ์ "ดี" เว็บไซต์จะจัดอยู่ในประเภทมีประสิทธิภาพ "ดี" สําหรับเมตริกนั้น ในทางกลับกัน หากการดูหน้าเว็บอย่างน้อย 25 เปอร์เซ็นต์มีคุณสมบัติตรงตามเกณฑ์ "แย่" ระบบจะจัดประเภทเว็บไซต์ดังกล่าวว่ามีประสิทธิภาพ "แย่" ตัวอย่างเช่น LCP เปอร์เซ็นไทล์ที่ 75 ซึ่งเท่ากับ 2 วินาทีจะจัดอยู่ในระดับ "ดี" ส่วน LCP เปอร์เซ็นไทล์ที่ 75 ซึ่งเท่ากับ 5 วินาทีจะจัดอยู่ในระดับ "ช้า"

เกณฑ์สำหรับเกณฑ์เมตริก Core Web Vitals

ในส่วนนี้ เราจะดูเกณฑ์ในการประเมินเกณฑ์ของเมตริก Core Web Vitals ส่วนต่อๆ ไปจะอธิบายรายละเอียดเพิ่มเติมเกี่ยวกับการใช้เกณฑ์เหล่านี้เพื่อเลือกเกณฑ์สำหรับเมตริกแต่ละรายการ ในปีต่อๆ ไป เราคาดว่าจะมีการปรับปรุงและเพิ่มเกณฑ์และเกณฑ์เพื่อปรับปรุงความสามารถในการวัดประสบการณ์การใช้งานที่ยอดเยี่ยมบนเว็บให้ดียิ่งขึ้น

ประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง

เป้าหมายหลักของเราคือการเพิ่มประสิทธิภาพเพื่อผู้ใช้และคุณภาพของประสบการณ์การใช้งาน ด้วยเหตุนี้ เราจึงมุ่งมั่นที่จะทำให้หน้าเว็บที่เป็นไปตามเกณฑ์ "ดี" ของ Core Web Vitals มอบประสบการณ์การใช้งานที่มีคุณภาพสูงแก่ผู้ใช้

เราพิจารณาการรับรู้ของมนุษย์และการวิจัย HCI เพื่อระบุเกณฑ์ที่เกี่ยวข้องกับประสบการณ์ของผู้ใช้ที่มีคุณภาพสูง แม้ว่าบางครั้งจะมีการสรุปการวิจัยนี้โดยใช้เกณฑ์คงที่เพียงเกณฑ์เดียว แต่เราพบว่าการวิจัยที่เกี่ยวข้องมักจะแสดงเป็นช่วงของค่า ตัวอย่างเช่น บางครั้งการวิจัยเกี่ยวกับระยะเวลาที่ผู้ใช้มักจะรอก่อนที่จะเสียสมาธิจะอธิบายเป็น 1 วินาที แต่การวิจัยที่เกี่ยวข้องจะแสดงเป็นช่วงตั้งแต่หลายร้อยมิลลิวินาทีไปจนถึงหลายวินาที ความจริงที่ว่าเกณฑ์การรับรู้นั้นแตกต่างกันไปโดยขึ้นอยู่กับผู้ใช้และบริบทได้รับการสนับสนุนเพิ่มเติมจากข้อมูลเมตริก Chrome ที่รวบรวมและลบข้อมูลระบุตัวบุคคลออก ซึ่งแสดงให้เห็นว่าไม่มีระยะเวลาที่แน่นอนที่ผู้ใช้รอให้หน้าเว็บแสดงเนื้อหาก่อนที่จะยกเลิกการโหลดหน้าเว็บ แต่ข้อมูลนี้แสดงการกระจายที่ราบรื่นและต่อเนื่อง ดูข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับเกณฑ์การรับรู้ของมนุษย์และการวิจัย HCI ที่เกี่ยวข้องได้ที่วิทยาศาสตร์เบื้องหลัง WebVitals

ในกรณีที่มีงานวิจัยเกี่ยวกับประสบการณ์ของผู้ใช้ที่เกี่ยวข้องสําหรับเมตริกหนึ่งๆ และมีความเห็นพ้องกันในระดับหนึ่งเกี่ยวกับช่วงของค่าในเอกสาร เราจะใช้ช่วงนี้เป็นข้อมูลในการแนะนํากระบวนการเลือกเกณฑ์ ในกรณีที่ไม่มีงานวิจัยเกี่ยวกับประสบการณ์ของผู้ใช้ที่เกี่ยวข้อง เช่น สําหรับเมตริกใหม่ เช่น การเปลี่ยนแปลงเลย์เอาต์แบบสะสม เราจะประเมินหน้าเว็บในชีวิตจริงที่ตรงตามเกณฑ์ต่างๆ ที่เป็นไปได้สําหรับเมตริกแทน เพื่อระบุเกณฑ์ที่ส่งผลให้ผู้ใช้ได้รับประสบการณ์การใช้งานที่ดี

ทำได้โดยใช้เนื้อหาเว็บที่มีอยู่

นอกจากนี้ เรากำหนดให้เนื้อหาที่มีอยู่บนเว็บต้องเป็นไปตามเกณฑ์เหล่านี้เพื่อให้เจ้าของเว็บไซต์เพิ่มประสิทธิภาพเว็บไซต์ให้บรรลุเกณฑ์ "ดี" ได้ ตัวอย่างเช่น แม้ว่า 0 มิลลิวินาทีจะเป็นเกณฑ์ "ดี" ของ LCP ที่เหมาะสม ซึ่งส่งผลให้ผู้ใช้ได้รับประสบการณ์การโหลดทันที แต่ในกรณีส่วนใหญ่ เกณฑ์ 0 มิลลิวินาทีนั้นแทบจะเป็นไปไม่ได้เนื่องจากเวลาในการตอบสนองของเครือข่ายและการประมวลผลของอุปกรณ์ ดังนั้น 0 มิลลิวินาทีจึงไม่ใช่เกณฑ์ "ดี" ที่สมเหตุสมผลของ LCP สําหรับ Core Web Vitals

เมื่อประเมินเกณฑ์ "ดี" ของ Core Web Vitals ที่จะสมัครรับป้าย เราตรวจสอบว่าเกณฑ์เหล่านั้นทำได้จริง โดยอิงตามข้อมูลจากรายงานประสบการณ์ของผู้ใช้ Chrome (CrUX) เราต้องการตรวจสอบว่าเกณฑ์นั้นทำได้จริง โดยกำหนดให้ต้นทางอย่างน้อย 10% มีคุณสมบัติตรงตามเกณฑ์ "ดี" นอกจากนี้ เรายังตรวจสอบว่าเนื้อหาที่ได้รับการเพิ่มประสิทธิภาพอย่างดีมีคุณสมบัติตรงตามเกณฑ์ "ดี" เสมอ เพื่อให้มั่นใจว่าเว็บไซต์ที่ได้รับการเพิ่มประสิทธิภาพอย่างดีจะไม่ได้รับการจัดประเภทไม่ถูกต้องเนื่องจากความแปรปรวนของข้อมูลภาคสนาม

ในทางกลับกัน เราจะกำหนดเกณฑ์ "แย่" โดยระบุระดับประสิทธิภาพที่แหล่งที่มาเพียงส่วนน้อยเท่านั้นที่ไม่เป็นไปตามเกณฑ์ เว้นแต่จะมีงานวิจัยที่เกี่ยวข้องกับการกำหนดเกณฑ์ "แย่" โดยค่าเริ่มต้น ระบบจะจัดประเภทต้นทางที่มีประสิทธิภาพแย่ที่สุด 10-30% เป็น "แย่"

กำหนดเกณฑ์เดียวกันหรือแตกต่างกันในแต่ละอุปกรณ์

โดยทั่วไป การใช้งานบนอุปกรณ์เคลื่อนที่และเดสก์ท็อปมีลักษณะที่แตกต่างกันมากในแง่ความสามารถของอุปกรณ์และความน่าเชื่อถือของเครือข่าย ข้อมูลนี้ส่งผลต่อเกณฑ์ "ความเป็นไปได้" อย่างมาก เราจึงควรพิจารณาเกณฑ์แยกกันสำหรับแต่ละรายการ

อย่างไรก็ตาม ความคาดหวังของผู้ใช้เกี่ยวกับประสบการณ์ที่ดีหรือไม่ดีนั้นไม่ได้ขึ้นอยู่กับอุปกรณ์ แม้ว่าเกณฑ์การบรรลุเป้าหมายจะขึ้นอยู่กับอุปกรณ์ก็ตาม ด้วยเหตุนี้ เกณฑ์ที่แนะนำของ Core Web Vitals จึงไม่ได้แยกตามอุปกรณ์และใช้เกณฑ์เดียวกันสำหรับทั้ง 2 อุปกรณ์ ซึ่งยังมีข้อดีเพิ่มเติมอีกอย่างหนึ่งคือทำให้เข้าใจเกณฑ์ได้ง่ายขึ้น

นอกจากนี้ อุปกรณ์อาจไม่เหมาะกับหมวดหมู่ใดหมวดหมู่หนึ่งเสมอไป ปัจจัยนี้ควรอิงตามรูปแบบของอุปกรณ์ กำลังการประมวลผล หรือสภาพเครือข่าย การมีเกณฑ์เดียวกันมีข้อดีเพิ่มเติมในการหลีกเลี่ยงความซับซ้อนดังกล่าว

อุปกรณ์เคลื่อนที่มีขีดจํากัดมากกว่า จึงต้องมีการกําหนดเกณฑ์ส่วนใหญ่ตามความสามารถในการบรรลุผลบนอุปกรณ์เคลื่อนที่ ข้อมูลเหล่านี้มีแนวโน้มที่จะแสดงถึงเกณฑ์ของอุปกรณ์เคลื่อนที่มากกว่าเกณฑ์ร่วมจริงในอุปกรณ์ทุกประเภท อย่างไรก็ตาม เนื่องจากอุปกรณ์เคลื่อนที่มักเป็นแหล่งที่มาของการเข้าชมส่วนใหญ่สําหรับเว็บไซต์ส่วนใหญ่ คุณจึงไม่ต้องกังวลมากนัก

ความคิดเห็นสุดท้ายเกี่ยวกับเกณฑ์

เมื่อประเมินเกณฑ์ผู้สมัคร เราพบว่าเกณฑ์ขัดแย้งกันบ้างในบางครั้ง ตัวอย่างเช่น อาจมีความขัดแย้งระหว่างเกณฑ์ที่ทำได้อย่างต่อเนื่องกับการช่วยให้ผู้ใช้ได้รับประสบการณ์ที่ดีอย่างต่อเนื่อง นอกจากนี้ เนื่องจากโดยทั่วไปแล้วการวิจัยการรับรู้ของมนุษย์จะให้ค่าในช่วง และเมตริกพฤติกรรมของผู้ใช้แสดงการเปลี่ยนแปลงของพฤติกรรมอย่างค่อยเป็นค่อยไป เราจึงพบว่ามักไม่มีเกณฑ์ "ที่ถูกต้อง" เพียงเกณฑ์เดียวสําหรับเมตริกหนึ่งๆ ดังนั้น แนวทางของเราสําหรับ Core Web Vitals คือการเลือกเกณฑ์ที่ตรงกับเกณฑ์มากที่สุด ขณะเดียวกันก็ตระหนักดีว่าไม่มีเกณฑ์ใดที่สมบูรณ์แบบ และบางครั้งเราอาจต้องเลือกจากเกณฑ์ที่เหมาะสมหลายรายการ แทนที่จะถามว่า "เกณฑ์ที่เหมาะที่สุดคืออะไร" เรามุ่งเน้นที่การถามว่า "เกณฑ์ผู้สมัครใดบรรลุเกณฑ์ของเราได้ดีที่สุด"

ตัวเลือกเปอร์เซ็นไทล์

ดังที่กล่าวไว้ก่อนหน้านี้ เราใช้ค่าเปอร์เซ็นไทล์ที่ 75 ของการเข้าชมทั้งหมดในหน้าเว็บหรือเว็บไซต์นั้นๆ เพื่อจัดประเภทประสิทธิภาพโดยรวมของหน้าเว็บหรือเว็บไซต์ เราเลือกเปอร์เซ็นต์ที่ 75 ตามเกณฑ์ 2 ข้อ ประการแรก เปอร์เซ็นต์ควรช่วยให้มั่นใจว่าการเข้าชมหน้าเว็บหรือเว็บไซต์ส่วนใหญ่มีประสิทธิภาพในระดับเป้าหมาย ประการที่ 2 ค่าที่เปอร์เซ็นต์ไทล์ที่เลือกไม่ควรได้รับผลกระทบจากค่าผิดปกติมากเกินไป

เป้าหมายเหล่านี้ขัดแย้งกันอยู่บ้าง หากต้องการบรรลุเป้าหมายแรก เปอร์เซ็นต์ไทล์ที่สูงขึ้นมักจะเป็นตัวเลือกที่ดีกว่า อย่างไรก็ตาม เมื่อเปอร์เซ็นต์ไทล์สูงขึ้น โอกาสที่ค่าที่ได้จะได้รับผลกระทบจากค่าผิดปกติก็จะเพิ่มขึ้นด้วย หากการเข้าชมเว็บไซต์ 2-3 ครั้งเกิดขึ้นจากการเชื่อมต่อเครือข่ายที่ไม่เสถียรซึ่งส่งผลให้ตัวอย่าง LCP มีขนาดมากเกินไป เราไม่ต้องการให้การแบ่งประเภทเว็บไซต์ของเราขึ้นอยู่กับตัวอย่างที่ผิดปกติเหล่านี้ ตัวอย่างเช่น หากเราประเมินประสิทธิภาพของเว็บไซต์ที่มีการเข้าชม 100 ครั้งโดยใช้เปอร์เซ็นต์ส่วนสูง เช่น เปอร์เซ็นต์ส่วน 95 ก็จะมีเพียงตัวอย่างค่าผิดปกติ 5 รายการเท่านั้นที่ทําให้ค่าเปอร์เซ็นต์ส่วน 95 ได้รับผลกระทบจากค่าผิดปกติ

เนื่องจากเป้าหมายเหล่านี้ขัดแย้งกันเล็กน้อย หลังจากการวิเคราะห์ เราจึงสรุปว่าเปอร์เซ็นต์ไทล์ที่ 75 มีความสมดุลที่เหมาะสม เมื่อใช้เปอร์เซ็นต์ไทล์ที่ 75 เราพบว่าการเข้าชมเว็บไซต์ส่วนใหญ่ (3 ใน 4 รายการ) มีประสิทธิภาพในระดับเป้าหมายหรือดีกว่า นอกจากนี้ ค่าเปอร์เซ็นไทล์ 75 ยังมีแนวโน้มที่จะได้รับผลกระทบจากค่าที่ผิดปกติน้อยลง กลับไปที่ตัวอย่างของเรา สําหรับเว็บไซต์ที่มีการเข้าชม 100 ครั้ง การเข้าชม 25 ครั้งจะต้องรายงานตัวอย่างค่าที่ผิดปกติขนาดใหญ่เพื่อให้ค่าที่ 75 เปอร์เซ็นต์ไทล์ได้รับผลกระทบจากค่าที่ผิดปกติ แม้ว่าตัวอย่าง 25 จาก 100 รายการจะเป็นค่าผิดปกติได้ แต่ก็มีโอกาสน้อยกว่ากรณีเปอร์เซ็นไทล์ที่ 95

การแสดงผลเนื้อหาขนาดใหญ่ที่สุด

เกณฑ์ LCP ได้รับการกําหนดโดยคํานึงถึงคุณภาพของประสบการณ์และความสามารถในการบรรลุเป้าหมายต่อไปนี้

คุณภาพของประสบการณ์

1 วินาทีมักใช้เป็นระยะเวลาที่ผู้ใช้จะรอก่อนที่จะเริ่มเสียสมาธิกับงาน จากการตรวจสอบงานวิจัยที่เกี่ยวข้องอย่างละเอียด เราพบว่า 1 วินาทีเป็นค่าโดยประมาณที่อธิบายช่วงของค่าต่างๆ ตั้งแต่ประมาณหลายร้อยมิลลิวินาทีไปจนถึงหลายวินาที

แหล่งที่มา 2 แห่งที่มักอ้างอิงถึงสำหรับเกณฑ์ 1 วินาที ได้แก่ Card และคนอื่นๆ และ Miller Card กําหนดเกณฑ์ "การตอบกลับทันที" 1 วินาที โดยอ้างอิงจากทฤษฎีการรับรู้แบบรวมของ Newell Newell อธิบายการตอบสนองทันทีว่า "การตอบสนองที่ต้องทำต่อสิ่งเร้าบางอย่างภายในประมาณ 1 วินาที (นั่นคือประมาณ 0.3-3 วินาที)" ซึ่งสอดคล้องกับการพูดคุยของ Newell เกี่ยวกับ "ข้อจำกัดแบบเรียลไทม์ในการคิด" ซึ่งมีการระบุว่า "การโต้ตอบกับสภาพแวดล้อมที่กระตุ้นการพิจารณาทางปัญญาเกิดขึ้นในระยะเวลาประมาณ 1-2 วินาที" ซึ่งอยู่ในช่วงประมาณ 0.5 ถึง 2-3 วินาที Miller ซึ่งเป็นแหล่งข้อมูลอีกแหล่งหนึ่งที่มักอ้างอิงถึงเกณฑ์ 1 วินาทีได้กล่าวว่า "งานซึ่งมนุษย์สามารถทำได้และจะทำด้วยการสื่อสารด้วยเครื่องจักรจะเปลี่ยนแปลงลักษณะการทำงานอย่างรุนแรงหากความล่าช้าในการตอบกลับนานกว่า 2 วินาที และอาจนานกว่านั้นอีก 1 วินาทีหรือประมาณนั้น"

งานวิจัยของ Miller และ Card อธิบายระยะเวลาที่ผู้ใช้จะรอก่อนที่จะเสียสมาธิเป็นช่วงๆ ตั้งแต่ประมาณ 0.3 ถึง 3 วินาที ซึ่งบ่งชี้ว่าเกณฑ์ LCP "ดี" ควรอยู่ในช่วงนี้ นอกจากนี้ เนื่องจากเกณฑ์ "ดี" ของ First Contentful Paint ที่มีอยู่คือ 1 วินาที และโดยทั่วไปแล้ว Largest Contentful Paint จะแสดงขึ้นหลังจาก First Contentful Paint เราจึงจำกัดช่วงเกณฑ์ LCP ที่เป็นไปได้เพิ่มเติมจาก 1 วินาทีเป็น 3 วินาที ในการเลือกเกณฑ์ในช่วงนี้ที่ตรงกับเกณฑ์ของเรามากที่สุด เราจะพิจารณาความเป็นไปได้ของเกณฑ์เหล่านี้ในลำดับถัดไป

ความสามารถในการบรรลุ

การใช้ข้อมูลจาก CrUX ช่วยให้เราระบุเปอร์เซ็นต์ของต้นทางในเว็บที่มีคุณสมบัติตรงตามเกณฑ์ "ดี" ของ LCP ที่เป็นไปได้

  1 วินาที 1.5 วินาที 2 วินาที 2.5 วินาที 3 วินาที
phone 3.5% 13% 27% 42% 55%
desktop 6.9% 19% 36% 51% 64%
% ของต้นทาง CrUX ที่จัดประเภทเป็น "ดี" สำหรับเกณฑ์ LCP ที่เป็นไปได้ ณ เดือนเมษายน 2020

แม้ว่าต้นทางไม่ถึง 10% จะเป็นไปตามเกณฑ์ 1 วินาที แต่เกณฑ์อื่นๆ ทั้งหมดตั้งแต่ 1.5 ถึง 3 วินาทีเป็นไปตามข้อกำหนดของเราที่ว่าต้นทางอย่างน้อย 10% ต้องเป็นไปตามเกณฑ์ "ดี" จึงยังคงเป็นตัวเลือกที่ถูกต้อง

นอกจากนี้ เรายังวิเคราะห์ประสิทธิภาพ LCP สําหรับเว็บไซต์ที่มีประสิทธิภาพสูงสุดในเว็บเพื่อพิจารณาเกณฑ์ที่เว็บไซต์เหล่านี้ทำได้อย่างต่อเนื่อง เพื่อให้มั่นใจว่าเกณฑ์ที่เลือกไว้จะบรรลุได้อย่างต่อเนื่องสําหรับเว็บไซต์ที่ได้รับการเพิ่มประสิทธิภาพอย่างดี กล่าวโดยละเอียดคือ เราต้องการระบุเกณฑ์ที่ทำได้อย่างต่อเนื่องที่เปอร์เซ็นต์ไทล์ 75 สำหรับเว็บไซต์ที่มีประสิทธิภาพสูงสุด เราพบว่าเกณฑ์ 1.5 และ 2 วินาทีนั้นทำได้ไม่สม่ำเสมอ แต่เกณฑ์ 2.5 วินาทีทำได้สม่ำเสมอ

เราใช้ข้อมูล CrUX เพื่อระบุเกณฑ์ "แย่" สําหรับ LCP โดยพิจารณาจากเกณฑ์ที่ต้นทางส่วนใหญ่มีคุณสมบัติตรงตามเกณฑ์ต่อไปนี้

  3 วินาที 3.5 วินาที 4 วินาที 4.5 วินาที 5 วินาที
phone 45% 35% 26% 20% 15%
desktop 36% 26% 19% 14% 10%
% ของต้นทาง CrUX ที่จัดประเภทเป็น "แย่" สำหรับเกณฑ์ LCP ที่เป็นไปได้ ณ เดือนเมษายน 2020

สำหรับเกณฑ์ 4 วินาที ต้นทางจากโทรศัพท์ประมาณ 26% และต้นทางจากเดสก์ท็อปประมาณ 21% จะจัดอยู่ในระดับ "แย่" ซึ่งอยู่ในช่วงเป้าหมาย 10-30% เราจึงสรุปได้ว่า 4 วินาทีเป็นเกณฑ์ "ไม่ดี" ที่ยอมรับได้

เราจึงสรุปได้ว่า 2.5 วินาทีเป็นเกณฑ์ "ดี" ที่สมเหตุสมผล และ 4 วินาทีเป็นเกณฑ์ "แย่" ที่สมเหตุสมผลสำหรับการแสดงผลเนื้อหาขนาดใหญ่ที่สุด (LCP)

การโต้ตอบกับ Next Paint

เกณฑ์ INP ได้รับการกําหนดโดยคํานึงถึงคุณภาพของประสบการณ์และความสามารถในการบรรลุเป้าหมายต่อไปนี้

คุณภาพของประสบการณ์

การวิจัยมีความสอดคล้องกันพอสมควรในการสรุปว่าความล่าช้าของการแสดงผลภาพสูงสุดประมาณ 100 มิลลิวินาทีนั้นเกิดจากแหล่งที่มาที่เกี่ยวข้อง เช่น อินพุตของผู้ใช้ ซึ่งหมายความว่าเกณฑ์ "ดี" ของการโต้ตอบกับ Next Paint ที่เหมาะควรควรอยู่ใกล้กับค่านี้

บทความเวลาในการตอบสนอง: ขีดจํากัดที่สําคัญ 3 ข้อของ Jakob Nielsen ที่มักมีการอ้างอิงจะกําหนด 0.1 วินาทีเป็นขีดจํากัดเพื่อให้ผู้ใช้รู้สึกว่าระบบตอบสนองทันที Nielsen อ้างอิง Miller และ Card ซึ่งอ้างอิงจากบทความการรับรู้ถึงสาเหตุของ Michotte ในปี 1962 ในการศึกษาของ Michotte ผู้เข้าร่วมการทดสอบจะเห็น "วัตถุ 2 รายการบนหน้าจอ วัตถุ ก เริ่มออกเดินทางและมุ่งหน้าไปยัง ข มันจะหยุดเมื่อสัมผัสกับ B ส่วน B จะเริ่มทำงานและเคลื่อนออกจาก A" Michotte เปลี่ยนช่วงเวลาระหว่างที่วัตถุ ก หยุดลงและวัตถุ ข เริ่มเคลื่อนไหว Michotte พบว่าเมื่อเกิดความล่าช้าประมาณ 100 มิลลิวินาที ผู้เข้าร่วมจะรู้สึกว่าวัตถุ ก เป็นสาเหตุที่ทําให้วัตถุ ข เคลื่อนไหว สำหรับความล่าช้าตั้งแต่ประมาณ 100-200 มิลลิวินาที การรับรู้ถึงความสัมพันธ์เชิงสาเหตุจะผสมปนกัน และสำหรับความล่าช้ามากกว่า 200 มิลลิวินาที ระบบจะไม่ถือว่าการเคลื่อนไหวของวัตถุ ข. เกิดจากวัตถุ ก. อีกต่อไป

ในทำนองเดียวกัน Miller ได้กำหนดเกณฑ์การตอบสนองสำหรับ "การตอบสนองต่อการเปิดใช้งานการควบคุม" ว่า "การบ่งชี้การดําเนินการซึ่งโดยปกติแล้วเกิดจากการขยับของปุ่ม สวิตช์ หรือส่วนควบคุมอื่นๆ ที่ส่งสัญญาณว่ามีการดําเนินการจริง การตอบสนองนี้ควร…รับรู้เป็นส่วนหนึ่งของการดําเนินการเชิงกลที่เกิดจากผู้ดําเนินการ เวลาหน่วง: ไม่เกิน 0.1 วินาที" และต่อมา "เวลาหน่วงระหว่างการกดแป้นกับการแสดงผลภาพไม่ควรเกิน 0.1 ถึง 0.2 วินาที"

เมื่อเร็วๆ นี้ ในบทความก้าวสู่ปุ่มเสมือนที่สมบูรณ์แบบตามเวลา Kaaresoja และคนอื่นๆ ได้ตรวจสอบการรับรู้ถึงความพร้อมกันระหว่างการสัมผัสปุ่มเสมือนบนหน้าจอสัมผัสกับการแสดงผลภาพต่อๆ มาซึ่งบ่งบอกว่ามีการสัมผัสปุ่มนั้นๆ สำหรับความล่าช้าต่างๆ เมื่อความล่าช้าระหว่างการกดปุ่มกับการแสดงผลภาพมีระยะเวลาไม่เกิน 85 มิลลิวินาที ผู้เข้าร่วมรายงานว่าการแสดงผลภาพปรากฏขึ้นพร้อมกันกับการกดปุ่ม 75% ของเวลา นอกจากนี้ สำหรับการหน่วงเวลา 100 มิลลิวินาทีหรือน้อยกว่า ผู้เข้าร่วมรายงานว่าคุณภาพการกดปุ่มที่รับรู้นั้นสูงอย่างต่อเนื่อง โดยคุณภาพที่รับรู้จะลดลงเมื่อการหน่วงเวลาอยู่ที่ 100-150 มิลลิวินาที และลดลงถึงระดับต่ำมากเมื่อการหน่วงเวลาอยู่ที่ 300 มิลลิวินาที

จากข้อมูลนี้ เราสรุปได้ว่างานวิจัยชี้ว่า 100 มิลลิวินาทีเป็นเกณฑ์ "ดี" ของการโต้ตอบกับ Next Paint สําหรับ Web Vitals นอกจากนี้ การที่ผู้ใช้รายงานคุณภาพในระดับต่ำเมื่อเกิดความล่าช้า 300 มิลลิวินาทีขึ้นไป ควรจะถือเป็นเกณฑ์ "แย่"

ความสามารถในการบรรลุ

เมื่อใช้ข้อมูลจาก CrUX เราพบว่าต้นทางส่วนใหญ่ในเว็บมีคุณสมบัติตรงตามเกณฑ์ "ดี" ของ INP 200 มิลลิวินาทีที่เปอร์เซ็นต์ไทล์ 75 ดังนี้

  100 มิลลิวินาที 200 มิลลิวินาที 300 มิลลิวินาที 400 มิลลิวินาที 500 มิลลิวินาที
phone 12% 56% 76% 88% 92%
desktop 83% 96% 98% 99% 99%
% ของต้นทาง CrUX ที่จัดประเภทเป็น "ดี" สำหรับเกณฑ์ INP ที่เป็นไปได้ ณ เดือนพฤษภาคม 2022

นอกจากนี้ เรายังให้ความสำคัญเป็นพิเศษกับความสามารถในการส่ง INP สำหรับอุปกรณ์เคลื่อนที่ระดับล่าง ซึ่งอุปกรณ์เหล่านี้คิดเป็นสัดส่วนสูงในการเข้าชมเว็บไซต์ ซึ่งยืนยันความเหมาะสมของเกณฑ์ 200 มิลลิวินาทีเพิ่มเติม

เมื่อพิจารณาถึงเกณฑ์ 100 มิลลิวินาทีที่สนับสนุนโดยการศึกษาเกี่ยวกับคุณภาพของประสบการณ์และเกณฑ์การบรรลุผล เราสรุปได้ว่า 200 มิลลิวินาทีเป็นเกณฑ์ที่เหมาะสมสําหรับประสบการณ์ที่ดี

เราใช้ข้อมูล CrUX เพื่อระบุเกณฑ์ "แย่" สําหรับ LCP โดยพิจารณาจากเกณฑ์ที่แหล่งที่มาส่วนใหญ่มีคุณสมบัติตรงตามเกณฑ์ต่อไปนี้

  100 มิลลิวินาที 200 มิลลิวินาที 300 มิลลิวินาที 400 มิลลิวินาที 500 มิลลิวินาที
phone 88% 44% 24% 12% 8%
desktop 17% 4% 2% 1% 1%
% ของต้นทาง CrUX ที่จัดประเภทเป็น "แย่" สำหรับเกณฑ์ INP ที่เป็นไปได้ ณ เดือนพฤษภาคม 2022

ซึ่งหมายความว่าเรามีเกณฑ์ "แย่" ที่ 300 มิลลิวินาที

อย่างไรก็ตาม INP กลับมีความเกี่ยวข้องแบบผกผันกับความนิยม ซึ่งแตกต่างจาก LCP และ CLS กล่าวคือ เว็บไซต์ที่ได้รับความนิยมมักจะซับซ้อนกว่า จึงมีแนวโน้มที่จะมีค่า INP สูงกว่า เมื่อพิจารณาเว็บไซต์ 10,000 อันดับแรก ซึ่งเป็นเว็บไซต์ส่วนใหญ่ที่ผู้ใช้อินเทอร์เน็ตเข้าชม เราพบว่าภาพรวมมีความซับซ้อนมากขึ้น

  100 มิลลิวินาที 200 มิลลิวินาที 300 มิลลิวินาที 400 มิลลิวินาที 500 มิลลิวินาที
phone 97% 77% 55% 37% 24%
desktop 48% 17% 8% 4% 2%
% ของต้นทาง CrUX ใน 10,000 อันดับแรกที่จัดว่าเป็น "ช้า" สำหรับเกณฑ์ INP ที่เป็นไปได้ ณ เดือนพฤษภาคม 2022

เกณฑ์ "แย่" 300 มิลลิวินาทีในอุปกรณ์เคลื่อนที่จะจัดประเภทเว็บไซต์ยอดนิยมส่วนใหญ่เป็น "แย่" ซึ่งจะขยายเกณฑ์การบรรลุเป้าหมายของเรา ส่วนเกณฑ์ 500 มิลลิวินาทีจะเหมาะกับเว็บไซต์ประมาณ 10-30% มากกว่า นอกจากนี้ โปรดทราบว่าเกณฑ์ "ดี" ที่ 200 มิลลิวินาทีนั้นยังเข้มงวดกว่าสำหรับเว็บไซต์เหล่านี้ด้วย แต่เว็บไซต์ 23% ยังคงผ่านเกณฑ์นี้บนอุปกรณ์เคลื่อนที่ ซึ่งยังผ่านเกณฑ์อัตราการผ่านขั้นต่ำ 10%

ด้วยเหตุนี้ เราจึงสรุปว่า 200 มิลลิวินาทีเป็นเกณฑ์ "ดี" ที่สมเหตุสมผลสําหรับเว็บไซต์ส่วนใหญ่ และมากกว่า 500 มิลลิวินาทีเป็นเกณฑ์ "แย่" ที่สมเหตุสมผล

การเปลี่ยนเลย์เอาต์สะสม

เกณฑ์ CLS ได้รับการกําหนดโดยพิจารณาจากคุณภาพของประสบการณ์และความสามารถในการบรรลุเป้าหมายต่อไปนี้

คุณภาพของประสบการณ์

การเปลี่ยนเลย์เอาต์สะสม (CLS) คือเมตริกใหม่ที่วัดระดับการเปลี่ยนแปลงของเนื้อหาที่มองเห็นได้ของหน้าเว็บ เนื่องจาก CLS เป็นเมตริกใหม่ เราจึงไม่ทราบถึงงานวิจัยที่ระบุเกณฑ์สําหรับเมตริกนี้ได้โดยตรง ดังนั้น เราจึงประเมินหน้าเว็บในชีวิตจริงที่มีการเปลี่ยนแปลงเลย์เอาต์ในปริมาณที่แตกต่างกันเพื่อระบุจำนวนการเปลี่ยนแปลงสูงสุดที่ผู้ใช้ยอมรับได้ก่อนที่จะทำให้เกิดความขัดข้องอย่างมากเมื่อบริโภคเนื้อหาในหน้าเว็บ เพื่อหาเกณฑ์ที่สอดคล้องกับความคาดหวังของผู้ใช้ จากการทดสอบภายใน เราพบว่าระดับการเปลี่ยนแปลงตั้งแต่ 0.15 ขึ้นไปทำให้ผู้ใช้รู้สึกว่ามีการรบกวนอยู่เสมอ ส่วนการเปลี่ยนแปลงตั้งแต่ 0.1 ลงไปนั้นสังเกตได้แต่ไม่รบกวนมากนัก ดังนั้น แม้ว่าค่าการเปลี่ยนเลย์เอาต์เป็น 0 จะเหมาะที่สุด แต่เราสรุปว่าค่าสูงสุด 0.1 เป็นเกณฑ์ CLS ที่ "ดี"

ความสามารถในการบรรลุ

จากข้อมูล CrUX เราพบว่าต้นทางเกือบ 50% มี CLS เท่ากับ 0.05 หรือต่ำกว่า

  0.05 0.1 0.15
phone 49% 60% 69%
desktop 42% 59% 69%
% ของต้นทาง CrUX ที่จัดประเภทเป็น "ดี" สำหรับเกณฑ์ CLS ที่เป็นไปได้ ณ เดือนเมษายน 2020

แม้ว่าข้อมูล CrUX จะระบุว่า 0.05 อาจเป็นเกณฑ์ CLS "ดี" ที่สมเหตุสมผล แต่เราก็ตระหนักดีว่าบางกรณีการใช้งานนั้นหลีกเลี่ยงการเปลี่ยนเลย์เอาต์ที่รบกวนได้ยาก ตัวอย่างเช่น สำหรับเนื้อหาที่ฝังของบุคคลที่สาม เช่น การฝังโซเชียลมีเดีย บางครั้งระบบอาจไม่ทราบความสูงของเนื้อหาที่ฝังจนกว่าระบบจะโหลดเสร็จ ซึ่งอาจทำให้เลย์เอาต์เปลี่ยนมากกว่า 0.05 เราจึงสรุปได้ว่าแม้ว่าต้นทางจำนวนมากจะเป็นไปตามเกณฑ์ 0.05 แต่เกณฑ์ CLS ที่เข้มงวดน้อยกว่าเล็กน้อยที่ 0.1 จะให้ความสมดุลที่ดีขึ้นระหว่างคุณภาพของประสบการณ์และความสามารถในการบรรลุ เราหวังว่าในอนาคตระบบนิเวศของเว็บจะระบุโซลูชันเพื่อจัดการกับการเปลี่ยนแปลงเลย์เอาต์ที่เกิดจากการฝังของบุคคลที่สาม ซึ่งจะช่วยให้ใช้เกณฑ์ "ดี" ของ CLS ที่เข้มงวดมากขึ้นที่ 0.05 หรือ 0 ใน Core Web Vitals เวอร์ชันถัดไปได้

นอกจากนี้ เราใช้ข้อมูล CrUX เพื่อระบุเกณฑ์ที่แหล่งที่มาส่วนใหญ่มีคุณสมบัติตรงตามเพื่อกำหนดเกณฑ์ "แย่" สำหรับ CLS ดังนี้

  0.15 0.2 0.25 0.3
phone 31% 25% 20% 18%
desktop 31% 23% 18% 16%
% ของต้นทาง CrUX ที่จัดประเภทเป็น "แย่" สำหรับเกณฑ์ CLS ที่เป็นไปได้ ณ เดือนเมษายน 2020

สำหรับเกณฑ์ 0.25 แหล่งที่มาของโทรศัพท์ประมาณ 20% และแหล่งที่มาของเดสก์ท็อปประมาณ 18% จะจัดอยู่ในระดับ "แย่" ซึ่งอยู่ในช่วงเป้าหมาย 10-30% เราจึงสรุปว่า 0.25 เป็นเกณฑ์ "แย่" ที่ยอมรับได้